طبقه بندی یک روش یادگیری ماشینی نظارت شده است که در آن مدل سعی می کند برچسب صحیح یک داده ورودی داده شده را پیش بینی کند. یکی از الگوریتم های مورد استفاده برای طبقه بندی “Logistic Regression” می باشد.
در اینجا، ما از دیتاست diabetes.csv برای اهداف طبقه بندی استفاده می کنیم و می توانید این دیتاست را از لینک بالای این صفحه دانلود کنید. این دیتاست دارای 8 متغیر ویژگی است:
“Pregnancies”, “Glucose”, “Blood Pressure”, “Skin Thickness”, “Insulin”, “BMI”, “Diabetes Pedigree Function”, “Age”
و متغیر طبقه بندی برای هر مورد در دیتاست تشخیص این است که آیا شما دیابت دارید یا نه، که دارای 2 مقدار است:
“دیابتی” و “غیر دیابتی”.
در فرم بالا مقادیر 8 متغیر ویژگی را وارد می کنید و مدل در یک فرم پاپ آپ مشخص می کند که آیا دیابتیک هستید یا خیر.
توجه داشته باشید که محدوده هر متغیر ویژگی به شرح زیر است:
بارداری (بین 0 و 17)
گلوکز (بین 0 و 199)
فشار خون (بین 0 و 122)
ضخامت پوست (بین 0 و 99)
انسولین (بین 0 و 846)
BMI (بین 0 و 68)
تابع سوابق دیابتی (بین 0.07 و 2.42)
سن (بین 21 و 81)
کد نمونه مورد استفاده برای آموزش مدل طبقه بندی «Logistic Regression» در لینک بالای همین صفحه ارائه شده است. هر بار که این فرم را اجرا می کنید و پیش بینی های طبقه بندی اتفاق می افتد، مقادیر در پایگاه داده ذخیره می شوند و با لینک "نتایج" در بالای این صفحه، نتایج قبلی پیش بینی مدل را مشاهده خواهید کرد. اجرای اخیر شما به انتهای این لیست اضافه خواهد شد.