مطالعه MIT خطاهای برچسب زنی را در مجموعه داده های مورد استفاده برای آزمایش هوش مصنوعی پیدا می کند


یک تیم به سرپرستی دانشمندان کامپیوتر از ده مورد از مجموعه داده های پر استناد را برای آزمایش سیستم های مورد بررسی قرار دادند. آنها دریافتند که حدود 3/4 درصد از داده ها نادرست یا دارای برچسب نادرست هستند ، این امر می تواند در سیستم های هوش مصنوعی که از این مجموعه داده ها استفاده می کنند مشکلاتی ایجاد کند. و . خطاهایی از موضوعاتی مانند بررسی محصولات آمازون به وجود آمد که در واقع منفی بودند و برعکس ، مثبت مثبت نبودند و بالعکس.

برخی از خطاهای مبتنی بر تصویر ناشی از اختلاط گونه های جانوری است. برخی دیگر از عکسهای نادرست با اشیا کمتر برجسته (به عنوان مثال "بطری آب" به جای دوچرخه کوهستانی که به آن متصل شده است) به وجود آمده اند. یک مثال خاص تلخ که ظاهر شد گیجی نوزاد برای پستانک است.

در اطراف صدا از فیلم های YouTube قرار دارد. یوتیوب از یوتیوب که به مدت سه و نیم دقیقه با دوربین صحبت می کند ، با عنوان "زنگ کلیسا" برچسب خورده بود ، حتی اگر صدای شنیده شده فقط در 30 ثانیه گذشته باشد. خطای دیگری از طبقه بندی نادرست به عنوان ارکستر پدید آمد.

برای یافتن خطاهای احتمالی ، محققان از چارچوبی به نام استفاده کردند که مجموعه داده های مربوط به نویز برچسب (یا داده های بی ربط) را بررسی می کند. آنها با استفاده از اشتباهات احتمالی را تأیید کردند و حدود 54 درصد از داده های الگوریتم پرچم گذاری شده دارای برچسب های نادرست را یافتند. محققان دریافتند با حدود 5 میلیون (حدود 10 درصد از مجموعه داده) بیشترین خطا را داشته است. این تیم بنابراین هر کسی می تواند خطاهای برچسب را مرور کند.

برخی از خطاها نسبتاً جزئی هستند و برخی دیگر به نظر می رسد که موردی از تقسیم موها باشد (نمای نزدیک کلید فرمان Mac با عنوان "صفحه کلید کامپیوتر") هنوز درست است). گاهی اوقات ، رویکرد یادگیری با اعتماد به نفس نیز اشتباه می شود ، مانند اشتباه گرفتن یک تصویر با برچسب درست از چنگال تنظیم برای یک منوره.

اگر برچسب ها حتی کمی خاموش باشند ، این می تواند منجر به پیامدهای عظیمی در سیستم های یادگیری ماشین شود. اگر یک سیستم هوش مصنوعی نتواند تفاوتی بین مواد غذایی و چند خرچنگ تشخیص دهد ، اعتماد به آن با نوشیدن یک نوشیدنی دشوار خواهد بود.



منبع اصلی

ترجمه از تک باز

خبربده

نیازمندی های آلمان

بنیاد پیسفول