راهکار تازه برای تولید داده های مصنوعی و آموزش یک مدل یادگیری ماشین

به گزارش نکسترو، محققان دانشگاه های تهران و قم روشی برای تولید داده های مصنوعی عرضه کرده اند که می تواند تحولی در یادگیری ماشین، امنیت سایبری و جرم شناسی دیجیتال ایجاد نماید.

به گزارش نکسترو به نقل از دانشگاه تهران، در پژوهشی که به سرپرستی دکتر مهدی تیموری، دانشیار دانشکده سامانه های هوشمند دانشکدگان علوم و فناوری های میان رشته ای دانشگاه تهران و پژوهشگرهایی از دانشگاه قم انجام شده است، راه حل تازه ای برای تولید داده های مصنوعی و آموزش یک مدل یادگیری ماشین با بهره گیری از این داده ها پیشنهاد شده است.
دکتر مهدی تیموری، سرپرست این تیم تحقیقاتی درباره ی اهمیت این پژوهش اظهار داشت: «یکی از چالش های اساسی در کاربردهای عملی یادگیری ماشین، مسئله ی تعمیم پذیری است؛ یعنی این که یک مدل آموزش دیده چقدر می تواند در وضعیت و داده های متفاوت، از داده های آموزشی، عملکرد مطلوبی عرضه نماید. این مشکل خصوصاً در عرصه هایی مانند امنیت شبکه که داده های برچسب خورده کمیاب و اغلب محرمانه هستند، اهمیت بیشتری پیدا می کند. مطالعه اخیر برای پاسخ به همین چالش طراحی شده است.»
وی اضافه کرد: «در این پژوهش، با تمرکز بر پروتکلهای جغرافیایی مانند NMEA و KLV، روشی مبتنی بر مهندسی خاصیت ها و مدل سازی آماری-تحلیلی توزیع خاصیت ها معرفی و با بهره گیری از آن، مجموعه داده ای مصنوعی تولید شده است. سپس، یک مدل یادگیری ماشین تنها با همین داده های مصنوعی آموزش داده شده و عملکرد آن با داده های واقعی مورد ارزیابی قرار گرفته است. نتایج نشان میدهد که مدل آموزش دیده، حتی زمانی که داده ها دارای نویز هستند، دقت بالایی در شناسایی پروتکل ها دارد.»
عضو هیات علمی دانشکدگان علوم و تکنولوژی های جدید دانشگاه تهران اظهار داشت: «از خاصیت های برجسته ی این پژوهش، قابلیت تعمیم روش پیشنهادی به سایر حوزه های مبتنی بر یادگیری ماشین است. بااینکه مطالعه ی حاضر به طور دقیقتر بر شناسایی پروتکلهای جغرافیایی تمرکز دارد، اما رویکرد ارائه شده در تولید داده های مصنوعی می تواند در عرصه هایی مانند تشخیص نفوذ، تحلیل رفتار کاربران، تصویربرداری پزشکی، یا حتی در صنایع هوشمند مانند کشاورزی، لجستیک و حمل و نقل نیز کاربرد داشته باشد؛ خصوصاً در مواردی که داده های واقعی به سبب محدودیت های حریم خصوصی، امنیتی یا هزینه بر بودن، در دسترس نیستند.»
وی با اعلان اینکه یکی از مهم ترین دستاوردهای این پژوهش، کاهش وابستگی به داده های واقعی برچسب خورده است، گفت: «این مزیت نه فقط از نظر صرفه جویی در منابع و زمان اهمیت دارد، بلکه از نظر یافتن چاره ای عملی برای حفظ حریم خصوصی کاربران و شناسایی پروتکلهای نادر یا جدید مهمست.»
یافته های این پژوهش بتازگی از طرف الزویر در نشریه Forensic Science International: Digital Investigation انتشار یافته و بوسیله این لینک دردسترس است.

منبع: nextru.ir

1404/02/14

10:02:34

5.0 / 5

433

تگها: آموزش , امنیت , پژوهش , تكنولوژی

مطلب را می پسندید؟

(1)

(0)

تازه ترین مطالب مرتبط

نظرات بینندگان در مورد این مطلب

لطفا شما هم در مورد این مطلب نظر دهید

= ۷ بعلاوه ۲

ارسال نظر

راهکار تازه برای تولید داده های مصنوعی و آموزش یک مدل یادگیری ماشین

پربیننده ترین ها

پربحث ترین ها

جدیدترین ها

نكسترو