طبقه بندی یک روش یادگیری ماشینی نظارت شده است که در آن مدل سعی می کند برچسب صحیح یک داده ورودی داده شده را پیش بینی کند. یکی از الگوریتم هایی که برای طبقه بندی استفاده می شود، الگوریتم “Random Forest Classifier” است.
در اینجا، ما از دیتاست glass.csv برای اهداف طبقه بندی استفاده می کنیم و می توانید مجموعه داده را از لینک بالای این صفحه دانلود کنید. این مجموعه داده دارای 9 ویژگی است:
“RI”, “Na”, “Mg”, “Al”, “Si”, “K”, “Ca”, “Ba”, “Fe”
و متغیر پیش بینی برای هر مورد در دیتاست، نوع شیشه است که دارای 6 مقدار است:
“Building Windows Float Processed”, “Building Windows Non-Float Processed”, “Vehicle Windows Float Processed”, “Containers”, “Tableware”, “Headlamps”.
در فرم بالا مقادیر 9 متغیر ویژگی که عمدتاً مقادیر عناصر شیمیایی است را وارد می کنید و مدل در یک فرم پاپ آپ نوع شیشه را برمی گرداند. Random Forest Classifier نسبت به مدل های دیگر برای محاسبه زمان بیشتری می برد و برای مشاهده نتایج به صورت پاپ آپ باید بیشتر منتظر بمانید.
توجه داشته باشید که مقادیر و محدوده های هر متغیر ویژگی به شرح زیر است:
شاخص انعکاس (بین 1.51 و 1.53)
سدیم (بین 10.73 و 17.38)
منیزیم (بین 0 و 4.49)
آلومینیوم (بین 0.29 و 3.5)
سیلیسیوم (بین 69.81 و 75.41)
پتاسیم (بین 0 و 6.21)
کلیسیم (بین 5.43 و 16.19)
باریوم (بین 0 و 3.15)
آهن (بین 0 و 0.51)
کد نمونه مورد استفاده برای آموزش مدل طبقه بندی "جنگل تصادفی" در لینک بالای همین صفحه ارائه شده است. هر بار که این فرم را اجرا می کنید و پیش بینی های طبقه بندی اتفاق می افتد، مقادیر در پایگاه داده ذخیره می شوند و با لینک "نتایج" در بالای این صفحه، نتایج قبلی پیش بینی مدل را مشاهده خواهید کرد. اجرای اخیر شما به انتهای این لیست اضافه خواهد شد.