طبقه بندی یک روش یادگیری ماشینی نظارت شده است که در آن مدل سعی می کند برچسب صحیح یک داده ورودی داده شده را پیش بینی کند. یکی از الگوریتم های مورد استفاده برای طبقه بندی “Naïve Bayes Classifier” می باشد.
در اینجا، ما از دیتاست drug200.csv برای اهداف طبقه بندی استفاده می کنیم و می توانید مجموعه داده را از لینک بالای این صفحه دانلود کنید. این مجموعه داده دارای 5 ویژگی است:
“Age”, “Sex”, “Blood Pressure”, “Cholesterol”, “Sodium to Potassium Ratio”
و متغیر پیش بینی برای هر مورد در دیتاست، نوع دارویی است که باید مصرف کنید، که دارای 5 مقدار است:
“drugX”, “DrugY”, “drugA”, “drugB”, “drugC”.
در فرم بالا، مقادیر 5 ویژگی را وارد میکنید و مدل، نوع دارویی را که باید مصرف کنید را در یک فرم پاپ آپ برمیگرداند. از آنجایی که 3 متغیر ویژگی از دیتاست ما متنی و 2 مورد از آنها عددی است، برای استفاده از Naïve Bayes برای این مجموعه داده ترکیبی، باید متغیرهای ویژگی دسته بندی را به برچسب های عددی تبدیل کنیم و سپس می توانیم از طبقه بندی کننده Naïve Bayes استفاده کنیم.
توجه داشته باشید که مقادیر و محدوده های هر متغیر ویژگی به شرح زیر است:
سن (بین 15 و 75)
جنسیت (0 → زن , 1 → مرد)
فشار خون (0 → بالا , 1 → پائین, 2 → نرمال)
کلسترول (0 → بالا , 1 → نرمال)
نسبت سدیم به پتاسیم (بین 6.2 و 38.3)
کد نمونه مورد استفاده برای آموزش مدل طبقهبندی “Naïve Bayes” در لینک بالای این صفحه ارائه شده است. هر بار که این فرم را اجرا می کنید و پیش بینی های طبقه بندی اتفاق می افتد، مقادیر در پایگاه داده ذخیره می شوند و با لینک "نتایج" در بالای این صفحه، نتایج قبلی پیش بینی مدل را مشاهده خواهید کرد. اجرای اخیر شما به انتهای این لیست اضافه خواهد شد.