پرسش و پاسخ دانشجویان با برگزیده ایرانی جایزه مصطفی(ص)؛ چطور یک دانشمند ایرانی بر داده ها مسلط شد
در نشست کافه علم دانشگاه امیرکبیر، سید وهاب میررکنی، برگزیده ایرانی جایزه مصطفی(ص) در سال ۲۰۲۵، درباره طرح نوآورانه خود در زمینه دستهبندی سریع دادهها با استفاده از الگوریتم هش حساس به مجاورت مبتنی بر توزیعهای پایدار سخن گفت.
به گزارش خبرنگار مهر، سید وهاب میررکنی، برگزیده ایرانی جایزه مصطفی(ص) در سال ۲۰۲۵ در کافه علم دانشگاه صنعتی امیرکبیر که امروز با حضور دانشجویانی از دانشگاه های علوم پزشکی ایران، دانشگاه صنعتی امیرکبیر و همچنین دانشجویان خارجی مقیم ایران از جمله عراق، یمن و آذربایجان برگزار شد، درباره طرح نواورانه خود در خصوص توسعه طرح هش حساس به محاورت مبتنی بر توزیع های پایدار توضیح داد. او همچنین درباره چالشها و راهکارهای پردازش دادهها در ابعاد بالا توضیحاتی ارائه کرد.
این دانشمند ایرانی ابتدا به مسئله اصلی سرعت و دقت در پردازش دادههای با ابعاد بالا اشاره کرد و توضیح داد که تلاش برای افزایش سرعت پردازشها در فضای ابعاد بالا، اغلب با کاهش دقت در سطوح پایینتر همراه است. وی هشدار داد که این کاهش دقت میتواند باعث شود مدل اولیهای که در ابعاد بالا طراحی شده، کارایی لازم را نداشته باشد و در نتیجه کارایی کلی الگوریتم کاهش یابد.
وی افزود: از نظر تئوری، ساخت یک مدل دقیق که برای تمام دادهها قابل استفاده باشد، امکانپذیر نیست. در عوض، برخی دادهها را میتوان به صورت فشردهتر و بهینهتر پردازش کرد. میررکنی تأکید کرد که افزایش ابعاد دادهها معمولاً باعث افزایش دقت میشود، اما در مقابل زمان اجرای الگوریتم را نیز به شکل قابل توجهی افزایش میدهد.
موضوع بعدی که در این نشست مطرح شد، اهمیت ایجاد تعادل میان دقت و سرعت در فرآیند کاهش ابعاد دادهها بود. میررکنی گفت: باید با توجه به محدودیتها، تعادلی بهینه پیدا کنیم تا هم سرعت و هم دقت به اندازه کافی حفظ شود.
وی هدف خود را طراحی الگوریتمی معرفی کرد که بتواند برای طیف وسیعی از دادهها و شرایط مختلف، عملکرد قابل قبولی داشته باشد، البته با در نظر گرفتن ویژگیهای خاص هر مجموعه داده.
میررکنی توضیح داد که در فضاهای با ابعاد بسیار بالا، مفهوم شباهت میان دادهها به شدت کاهش مییابد، بهطوری که تقریباً همه دادهها شباهتی برابر به یکدیگر پیدا میکنند. این موضوع باعث میشود اگر فرآیند کاهش ابعاد به دقت انجام نشود، عملکرد الگوریتم در فضای ابعاد پایینتر به شدت افت کند و دقت آن کاهش یابد.
او راهکاری برای این مشکل ارائه داد و گفت: برای حفظ اطلاعات مهم دادهها از توابع خاصی به نام «توابع هش» استفاده میشود که انتخاب درست این توابع باید بر اساس ویژگیهای دادهها صورت گیرد تا بهترین نتایج حاصل شود.
این دانشمند ایرانی برای درک بهتر این مفهوم، مثالی ساده زد و گفت: فرض کنید یک شیء در فضای سهبعدی داریم و نورهایی از نقاط مختلف و به صورت تصادفی اما با ساختار منظم به آن میتابد. سایههای دو بعدی این شیء که از نورها ایجاد میشوند، میتوانند به حفظ و انتقال اطلاعات اصلی کمک کنند. این مثال به درک بهتر نحوه کاهش ابعاد و حفظ اطلاعات کمک میکند.
برگزیده جایزه مصطفی(ص) ۲۰۲۵،
در ادامه گفت: من در رشتهی ریاضی کاربردی در MIT مشغول بودم، اما در عمل بیشتر در حوزه علوم کامپیوتر فعالیت میکردم. آن دوره، با پروفسور دادلی آشنا شدم که در زمینههای مربوط به تئوری احتمال و هندسه ریاضی بسیار فعال بود. از طریق او به منابعی دست یافتم که دید من را نسبت به مسئله بازتر کرد و باعث شد تحلیلهای دقیقتری روی مدلها انجام دهم.
او به یکی از نکات کلیدی مقالهاش اشاره کرد و گفت: چیزی که باعث خاص شدن این کار شد، این بود که ما توانستیم نشان دهیم ایدهمان برای هر نوع فاصله (metric) کار میکند، نه فقط برای یک نوع خاص مثل ℓ₂. این یعنی الگوریتم ما نه فقط وابسته به نوع داده یا ساختار خاصی نیست، بلکه میتواند در بسیاری از فضاهای مختلف عملکرد مناسبی داشته باشد.
این دانشمند برگزیده ایرانی ادامه داد: الگوریتم ما هم از نظر تئوری جذاب است و هم در عمل عملکرد خوبی دارد. دلیل اصلی سرعت بالای آن، استفاده از یک سری روابط خاص بین توزیعهای تصادفی و حفظ ویژگی فاصلهها در فضای با ابعاد کم است. علاوه بر این، پیادهسازی این الگوریتم ساده است و میتواند به راحتی در محیطهای داینامیک، استریمینگ و حتی سیستمهای مقیاسپذیر به کار گرفته شود.
میررکنی در ادامه تأکید کرد که یکی از مهمترین جنبههای این پژوهش، تلفیق موفق میان تئوری و کاربرد بود؛ الگوریتمی که هم بنیان نظری محکمی دارد و هم در عمل میتواند در سیستمهای واقعی استفاده شود