طبقه بندی یک روش یادگیری ماشینی نظارت شده است که در آن مدل سعی می کند برچسب صحیح یک داده ورودی داده شده را پیش بینی کند.
یکی از الگوریتمهایی که برای طبقهبندی استفاده میشود، «Decision Tree Classifier» است.
در اینجا، ما از دیتاست fish.csv برای اهداف طبقه بندی استفاده می کنیم و می توانید این دیتاست را از لینک بالای این صفحه دانلود کنید.
این مجموعه داده دارای 6 متغیر است:
“ وزن ”, “ طول 1: طول عمودی ”, “ طول 2: طول قطری ”, “ طول 3: طول متقاطع ”, “ ارتفاع ” و “ عرض: عرض مورب ”
و متغیر طبقه بندی برای هر مورد در دیتاست، نوع ماهی است که دارای 7 مقدار است:
“Bream”, “Roach”, “Whitefish”, “Parkki”, “Perch”, “Pike”, “Smelt”.
در فرم بالا مقادیر 6 متغیر ویژگی را وارد می کنید و مدل در یک فرم پاپ آپ نوع ماهی را برمی گرداند. توجه داشته باشید که مقادیر و محدوده های هر متغیر ویژگی به شرح زیر است:
وزن (گرم): بین 5 و 1650
طول 1: طول عمودی (بین 7.5 تا 59 سانتی متر)
طول 2: طول قطری (بین 8.4 تا 63.4 سانتی متر)
طول 3: طول متقاطع (بین 8.8 تا 68 سانتی متر)
ارتفاع: (بین 1.72 تا 18.95 سانتی متر)
عرض: عرض قطری (بین 1.04 و 8.14 سانتی متر)
کد نمونه مورد استفاده برای آموزش مدل طبقه بندی «درخت تصمیم» در لینک بالای این صفحه ارائه شده است. هر بار که این فرم را اجرا می کنید و پیش بینی های طبقه بندی اتفاق می افتد، مقادیر در پایگاه داده ذخیره می شوند و با لینک "نتایج" در بالای این صفحه، نتایج قبلی پیش بینی مدل را مشاهده خواهید کرد. اجرای اخیر شما به انتهای این لیست اضافه خواهد شد.