هوش مصنوعی OpenAI یک مسئله ریاضی معروف را که ۸۰ سال همه را گیج کرده بود، حل کرد

تکفارس
نویسنده: عباس پور اشرف
چهارشنبه 13 خرداد 1405
هوش مصنوعی OpenAI یک مسئله ریاضی معروف را که ۸۰ سال همه را گیج کرده بود، حل کرد
هوش مصنوعی OpenAI یک مسئله ریاضی معروف را که ۸۰ سال همه را گیج کرده بود، حل کرد

شرکت OpenAI اعلام کرد که یک مدل هوش مصنوعی داخلی، حدس اردوش درباره مسئله فاصله واحد را که یکی از مسائل مشهور در هندسه محسوب می‌شود، نقض کرده است.

OpenAI این نتیجه را در اختیار چند ریاضیدان قرار داد و واکنش‌های آنها را منتشر کرد. تیم گاورز، برنده مدال فیلدز که بالاترین جایزه ریاضیات محسوب می‌شود، نوشت که شکی نیست حل مسئله فاصله واحد نقطه عطفی در ریاضیات هوش مصنوعی به حساب می‌آید.

دنیل لیت، استاد دانشگاه تورنتو، نیز نوشت که این اولین نمونه از نتیجه‌ای است که به طور خودمختار توسط هوش مصنوعی تولید شده و واقعا هیجان‌انگیز است، نه صرفاً به عنوان یک نشانه از پیشرفت‌های آینده.

به جرات می‌توان گفت این اولین باری بود که یک سامانه هوش مصنوعی اثباتی برای حل یک حدس باز و مهم ارائه می‌دهد. هرچند این دستاورد چشمگیر است، اما یک شکست رادیکال با مسیر قبلی پیشرفت هوش مصنوعی در ریاضیات محسوب نمی‌شود.

سه سال پیش، مدل‌های زبانی بزرگ در حل مسائل ساده حسابی هم دچار مشکل بودند. فقط سال گذشته بود که این مدل‌ها توانستند در مسابقات ریاضی دبیرستان موفق عمل کنند. از ماه ژانویه در نشست مشترک ریاضیات که بزرگ‌ترین گردهمایی سالانه ریاضیدانان جهان، سامانه‌های هوش مصنوعی شروع به مشارکت در پژوهش‌های ریاضی کرده‌اند، اما فقط در محیط‌های محدود. برای تبدیل خروجی هوش مصنوعی به یک قضیه قابل انتشار، به تفسیر قابل توجهی از سوی انسان نیاز بود.

نتیجه جدید OpenAI گام بعدی در این روند است. این مدل هوش مصنوعی، ایده‌های موجود از چندین زیرشاخه ریاضیات را به کار گرفته و اثبات کاملی ساخته. اما هیچ تکنیک واقعاً جدیدی را ابداع نکرده است. بعدها، ریاضیدانان انسانی این نتیجه را پالایش و گسترش دادند.

این وضعیت به آینده‌ای میان‌مدت اشاره دارد که در آن ریاضیدانان انسانی و مدل‌های هوش مصنوعی مکمل یکدیگرند: هوش مصنوعی دانش وسیع‌تری از کارهای گذشته نسبت به هر انسان زنده‌ای دارد و تمایل بیشتری برای دنبال کردن راهبردهای اثبات خسته‌کننده‌ای که احتمال موفقیتشان کم است، از خود نشان می‌دهد. اما انسان‌ها هنوز هم می‌توانند عمیق‌تر درباره هر مسئله بیندیشند و پرسش‌های جالب‌تری مطرح کنند.

شاید این وضعیت پایدار نماند. سامانه‌های هوش مصنوعی با چنان سرعتی در ریاضیات پیشرفت کرده‌اند که روشن نیست ده سال دیگر ریاضیدانان انسانی چه نقشی، اگر نقشی هم داشته باشند، ایفا خواهند کرد.

پل اردوش یکی از پرکارترین ریاضیدانان تاریخ بود. او در طول زندگی خود بیش از ۱۵۰۰ مقاله نوشت که رکوردی بی‌نظیر است. یکی از بزرگترین استعدادهای او طرح مسائلی بود که بیانشان ساده بود اما ریشه‌ای عمیق داشت.

او در سال ۱۹۴۶ مسئله فاصله واحد را مطرح کرد. فرض کنید تعدادی نقطه در یک صفحه دو بعدی دارید و فاصله بین هر جفت نقطه را اندازه می‌گیرید. در یک نمودار پنج نقطه‌ای و ده جفت نقطه، سه جفت دقیقاً به فاصله یک واحد از هم قرار دارند. سؤال این است که آیا می‌توان نقاط را چنان چید که تعداد جفت‌های با فاصله یک واحد بیشتر شود؟ پاسخ مثبت است. با جابه‌جایی نقاط می‌توان تعداد این جفت‌ها را به هفت رساند، اما بیشتر از آن ممکن نیست. همین تحلیل را می‌توان برای شش نقطه، هفت نقطه و بیشتر انجام داد، اما با زیاد شدن تعداد نقاط، مسئله به سرعت چنان پیچیده می‌شود که یافتن جواب دقیق ناممکن می‌گردد.

به همین دلیل، اردوش به جای یافتن تعداد دقیق فاصله‌های واحد برای تعداد مشخصی نقطه، تلاش کرد کران بالا و پایین برای تعداد خط‌های به طول یک، بر حسب n نقطه، به دست آورد، به شرط آن که n عدد بزرگی باشد.

برای محاسبه کران پایین، اردوش فرض کرد که نقاط در یک شبکه منظم چیده شده‌اند. این احتمالاً بهترین چیدمان نیست، اما اگر او می‌توانست نشان دهد نقاط در یک شبکه دارای تعداد معینی جفت با فاصله واحد هستند، آن گاه چیدمان بهینه حداقل آن تعداد را خواهد داشت.

ساده‌ترین گزینه شبکه‌ای است که هر نقطه با همسایه‌های بالا، پایین، چپ و راست خود فاصله یک داشته باشد. اما اردوش دید که با در نظر گرفتن قطرها می‌توان نتیجه بهتری گرفت. اگر فاصله شبکه را کوچک‌تر کنید، هر نقطه می‌تواند با تعداد بیشتری از همسایه‌های خود فاصله یک داشته باشد. اگر فاصله شبکه یک باشد، هر نقطه با چهار همسایه فاصله یک دارد، اما اگر فاصله شبکه یک‌پنجم باشد، هر نقطه با دوازده همسایه به فاصله یک می‌رسد.

شرح نتیجه جدید OpenAI شامل نموداری مبهم از نقاط در یک شبکه با خط‌های فراوان بود. اگر روی آن یک دایره رسم کنیم، درک نمودار آسان‌تر می‌شود. این شیوه به دلیل قضیه فیثاغورس کار می‌کند: اگر نقطه‌ای به اندازه a واحد در راستای افقی و b واحد در راستای عمودی از نقطه دیگر فاصله داشته باشد، فاصله c میان آن دو از رابطه a²+b²=c² به دست می‌آید. ترفند این است که عدد c² را چنان انتخاب کنیم که تعداد زیادی جفت عدد صحیح a و b داشته باشیم که a²+b²=c² را برآورده کنند. سپس شبکه را چنان کوچک می‌کنیم که فاصله هر نقطه با همسایه‌اش ۱/c شود؛ در آن صورت تعداد زیادی فاصله واحد خواهیم داشت.

برای نمونه، اگر c²=۲۵ را انتخاب کنیم، رابطه فیثاغورس با جفت (۰،۵) یا (۳،۴) برآورده می‌شود. این معادل دوازده نقطه روی یک دایره است. نمودار OpenAI بر پایه c²=۶۵ ساخته شده که با جفت‌های (۱،۸) و (۴،۷) ارضا می‌شود. یعنی اگر فاصله شبکه ۱/√۶۵ باشد، هر نقطه با شانزده نقطه دیگر فاصله واحد خواهد داشت. اگر c² بزرگتر باشد و به دقت انتخاب شود، تعداد قطرهای با طول صحیح بیشتر و در نتیجه جفت‌های فاصله واحد بیشتری خواهیم داشت.

البته اگر c² نسبت به تعداد نقاط شبکه خیلی بزرگ باشد، بسیاری از همسایه‌های بالقوه که فاصله یک واحد دارند، خارج از شبکه قرار می‌گیرند. به طور خلاصه، باید c² را انتخاب کرد که به اندازه کافی بزرگ باشد اما نه خیلی بزرگ. اردوش با استفاده از نظریه اعداد و قضیه مجموع دو مربع یاکوبی نشان داد که اندازه بهینه دایره باعث می‌شود تعداد جفت‌های با فاصله واحد سریع‌تر از تعداد نقاط رشد کند، اما فقط اندکی.

سؤال این بود که آیا می‌توان بهتر از این کار کرد؟ اردوش برای یافتن کران بالا، از استدلالی در نظریه گراف استفاده کرد تا نشان دهد تعداد فاصله‌های واحد نمی‌تواند از حدی فراتر رود. اما کران بالای او بسیار سریع‌تر از بهترین کران پایینی که ساخته بود، رشد می‌کند.

حدس اردوش این بود که مقدار بهینه بسیار به کران پایین نزدیک است تا کران بالا. او پیش‌بینی کرد که بیشترین تعداد فاصله‌های واحد فقط اندکی سریع‌تر از تعداد نقاط رشد می‌کند. به عبارت دقیق‌تر، اردوش حدس زد تعداد فاصله‌های واحد برابر n^(1+o(1)) خواهد بود؛ یعنی برای n به اندازه کافی بزرگ، بیشترین تعداد فاصله واحد از n^(1+ε) برای هر ε>۰ کمتر است. این مقدار می‌تواند کمی سریع‌تر از ساختار کران پایین او رشد کند، اما در همان محدوده کلی قرار دارد. اثبات این حدس به مسئله فاصله واحد معروف شد. در هشتاد سال بعد، به نظر می‌رسید اردوش درست می‌گوید. اما بعد یک مدل OpenAI او را غلط از آب درآورد.

حدس اردوش بر این بود که برای تعداد زیادی نقطه، یک شبکه مربعی تقریباً به اندازه سایر چیدمان‌ها، جفت‌های با فاصله واحد تولید می‌کند. هوش مصنوعی OpenAI با نشان دادن روشی پیچیده‌تر برای چیدن n نقطه که جفت‌های بیشتری را دقیقاً در فاصله یک واحد قرار می‌دهد، نادرستی این حدس را اثبات کرد.

دقیقاً به دلیل پیچیده‌تر بودن الگوی جدید نقاط، توضیح مختصر آن دشوار است. اما می‌توان آن را اصلاحی هوشمندانه روی شبکه اردوش در نظر گرفت. هوش مصنوعی یک شبکه در فضای با ابعاد بالا ساخت و سپس این ساختار پیچیده‌تر را به دو بعد تصویر کرد. و به جای استفاده از شبکه اعداد صحیح با نقاطی مثل (۱،۳) یا (۶-،۳)، از چیزی به نام اعداد صحیح جبری برای ساختن این شبکه پیچیده‌تر بهره برد. مشخص شد که این نوع شبکه با ابعاد بالا، ساختاری غنی‌تر دارد و به هوش مصنوعی اجازه می‌دهد تعداد بیشتری فاصله واحد را در همان تعداد نقطه جای دهد.

نمایش این چیدمان جایگزین دشوار است، زیرا فقط با تعداد بسیار زیادی از نقاط مزیت خود را نشان می‌دهد. اما در اینجا یک چیدمان ساده‌تر از نقاط به روش مشابه ساخته شده، وجود دارد. این چیدمان ۱۳۴۵ نقطه دارد و تنها ۵۹۱۶ فاصله واحد تولید می‌کند که از ۷۶۳۲ فاصله واحد حاصل از یک شبکه مربعی ۱۲۹۶ نقطه‌ای با روش اردوش کمتر است. اما تصور کلی این را می‌دهد که چگونه یک الگوی غیرشبکه‌ای می‌تواند فاصله واحد بیشتری نسبت به شبکه مربعی ایجاد کند.

الگوهای پیچیده‌تر نتیجه می‌دهند. هرچند اثبات مدل OpenAI به صراحت بیان نمی‌کند که برای n نقطه چند جفت فاصله واحد امکان‌پذیر است، ولی ویل ساوین، ریاضیدان انسانی، نشان داد که این تعداد حداقل با نرخ n به توان ۱/۰۱۴ رشد می‌کند. این رقم ممکن است کوچک به نظر برسد، اما وقتی n بسیار بزرگ شود، از تعداد حاصل از روش اردوش بسیار بیشتر خواهد شد.

با این حال، نتیجه هوش مصنوعی مسئله را کاملاً حل نکرده. بهترین کران بالایی که برای تعداد فاصله‌های واحد داریم حدود n به توان ۱/۳۳۳ است. برای بستن این شکاف به کار بیشتری نیاز هست. اگر دو هفته پیش و قبل از اعلام OpenAI، در مورد تازه‌ترین مشارکت‌های مدل‌های زبانی بزرگ در ریاضیات از ما می‌پرسیدید، احتمالاً به سامانه AlphaEvolve از گوگل دیپ‌مایند اشاره می‌کردیم.

AlphaEvolve از مدل‌های زبانی بزرگ به عنوان موتور یک فرایند بهینه‌سازی استفاده می‌کند. اگر بتوانید یک مسئله ریاضی را به قطعه کدی برای بهینه‌سازی تبدیل کنید که اغلب این کار شدنی است، مدل زبانی بزرگ ممکن است برای انواع خاصی از مسائل، راه حل‌های بهتری از آنچه انسان یافته، پیدا کند. در ماه نوامبر، چهار ریاضیدان از جمله ترنس تائو مقاله‌ای منتشر کردند که عملکرد AlphaEvolve را روی ۶۷ مسئله بهینه‌سازی در سراسر ادبیات ریاضی تحلیل می‌کرد. آنها دریافتند که AlphaEvolve در برخی موارد توانسته نسبت به ادبیات موجود بهبود ایجاد کند.

این گامی فراتر از مشارکت‌های پیشین مدل‌های زبانی بزرگ مثل مرور ادبیات بود، اما همچنان نیاز داشت انسان مسئله را در قالب یک مسئله بهینه‌سازی تعریف کند و خروجی هوش مصنوعی را به ریاضیات قابل استفاده تبدیل نماید. همچنین فقط انواع خاصی از مسائل با این روش قابل بررسی هستند. سؤالات مفهومی‌تری که عددی برای بهینه‌سازی ندارند، به راحتی با AlphaEvolve مطالعه نمی‌شوند.

بنابراین شرکت‌های فعال در زمینه هوش مصنوعی روی توسعه سامانه‌های مدل زبانی بزرگ کار کرده‌اند که بتوانند مستقیماً جواب درست هر مسئله ریاضی را تولید کنند. نتیجه OpenAI گام مهمی در این جهت است. اما همچنان در الگوی ریاضیات کمکی پیشین قرار می‌گیرد.

از جمله این که شرکت‌های دیگر نیز روی حل مسائل اردوش کار کرده‌اند. چون اردوش در طول دوران کاری خود صدها مسئله مطرح کرد و ریاضیدان توماس بلوم جمع‌آوری همه آنها را در وب‌سایت erdosproblems.com سامان داده، شرکت‌های هوش مصنوعی از آنها به عنوان زمین آزمایشی برای ارزیابی سامانه‌های خود استفاده کرده‌اند. در ماه ژانویه، کوین بارتو، دانشجوی مقطع کارشناسی دانشگاه کمبریج، به همراه یکی از دوستانش از GPT-5.2 و ارسطوی شرکت Harmonic خواست اولین راه حل خودمختار یک مسئله اردوش را تولید کنند. در ۲۲ مه، دو روز پس از اعلام OpenAI، گوگل اعلام کرد که سامانه هوش مصنوعیاش نه مسئله باز اردوش را حل کرده که دو تای آنها بیش از پنجاه سال بی‌پاسخ مانده بودند.

برای روشن شدن مطلب، مسئله‌ای که OpenAI حل کرده از هر کار دیگری که اشاره کردیم چشمگیرتر است. اما راه حل OpenAI بیش از آنکه نتیجه اصلی آن نشان دهد، با تلاش‌های پیشین هوش مصنوعی همخوانی دارد.

یکی از دلایلی که مسئله فاصله واحد با وجود شهرت بسیار، هشتاد سال بی‌پاسخ ماند، این بود که بیشتر مردم فکر می‌کردند حدس اردوش درست است. اما ابزارهای ریاضی موجود به هیچ وجه قادر به اثبات کران اردوش نیستند. بنابراین ریاضیدانان انتظار داشتند هر اثباتی برای این حدس، شامل ایده‌ها یا رویکردهای کاملاً جدیدی باشد.

در عوض، همان طور که دیدیم، هوش مصنوعی با بسط دادن ساختار اولیه اردوش، حدس را نقض کرد. این راه حلی هوشمندانه و غیربدیهی بود، اما شباهتی هم به نوع کار بهینه‌سازی انجام شده توسط سامانه‌ای مثل AlphaEvolve داشت.

این موضوع در برخی پاسخ‌های ریاضیدانان منعکس شده است. تیم گاورز، ریاضیدان، نوشت وقتی اولین بار نتیجه هوش مصنوعی را شنید، فکر کرد که این سامانه قضیه را اثبات کرده است. او گفت: آن شب را صرف تعدیل جهان‌بینی خود کردم و فکر می‌کردم اگر هوش مصنوعی بتواند چنین اثباتی ارائه دهد، شاید خیلی زود کار ریاضیدانان تمام شود. اما صبح روز بعد، گاورز و دیگر داوران بیرونی ایمیلی درباره این نتیجه دریافت کردند و او فهمید که مدل زبانی بزرگ به جای اثبات حدس، آن را نقض کرده است که برایش مایه آرامش بزرگی بود.

راه حل OpenAI همچنین دو ویژگی داشت که نقاط قوت مدل‌های هوش مصنوعی را نسبت به انسان برجسته می‌کرد. نخست، راه حل نهایی به کارگیری تکنیک‌های پیچیده از حوزه‌ای کاملاً متفاوت ریاضیات یعنی نظریه اعداد جبری بود. سامانه‌های هوش مصنوعی روی حجم عظیمی از ریاضیات آموزش دیده‌اند و دانش وسیع‌تری از کارهای پیشین ریاضی نسبت به هر انسانی در جهان دارند. برای یک انسان، حل این مسئله مستلزم داشتن دانش مرتبط با نظریه اعداد جبری و همزمان علاقه به مسئله فاصله واحد بود که ترکیبی نادر است.

دوم، فرایند استدلال آن قدر خسته‌کننده و ظاهراً ناموفق بود که بیشتر انسان‌ها آن را زحمت نمی‌دادند. یاکوب تزایمرمن، استاد دانشگاه تورنتو، در سند OpenAI اشاره کرد که خودش به طور مختصر رویکرد مشابهی را برای رد این حدس در نظر گرفته بود. اما این نوع تکنیک زمان زیادی می‌برد و اغلب به نتیجه نمی‌رسد، بنابراین آن پروژه را رها کرد.

از سوی دیگر، هوش مصنوعی می‌تواند بسیاری از راهبردهای اثبات که به نتیجه نمی‌رسند را پیش از یافتن یک راهبرد موفق، بررسی کند. OpenAI ممکن است مسئله را بارها اجرا کرده باشد تا یک مدل به راه حل رسیده باشد. در واقع، یک نمودار از OpenAI نشان داد که حتی با حداکثر بودجه توکن، مدل داخلی فقط در نیمی از موارد مسئله را حل می‌کند.

برای روشن شدن، کاری که سامانه هوش مصنوعی انجام داد همچنان چشمگیر است. تزایمرمن بعداً در اظهارنظر خود گفت که همیشه وسوسه‌انگیز است به یک اثبات تمام شده نگاه کنیم و بعد از آن، آن را بدیهی بنامیم. اما همان طور که قبلاً اشاره کردم، این راه حل نقاط قوت سامانه‌های هوش مصنوعی را نیز به کار می‌گرفت.

در کوتاه‌مدت تا میان‌مدت، این موضوع به جهانی اشاره دارد که در آن مدل‌های هوش مصنوعی مکمل انسان‌ها هستند نه جایگزین آنها. سامانه‌های هوش مصنوعی فهرست مسائل انتخاب‌شده توسط ریاضیدانان انسانی را بررسی می‌کنند یا به انسان‌ها در یافتن رویکردهای مرتبط از زمینه‌های به ظاهر نامرتبط ریاضی کمک می‌کنند. اما بلافاصله جای انسان را در انتخاب سؤال‌های مناسب یا توسعه تکنیک‌های کاملاً جدید نمی‌گیرند.

حتی این نتیجه نیز بسیار حاصل همکاری انسان و هوش مصنوعی بود. در حالی که سامانه هوش مصنوعی اثبات را به تنهایی یافت، ریاضیدانان انسانی نتیجه را تأیید کردند. انسان‌های دیگری اثبات‌های خواناتری نوشتند که ایده‌های اولیه هوش مصنوعی را گسترش می‌داد، مانند ویل ساوین که کران پایین صریحی را همان طور که گفتم یافت.

مشخص نیست این مکملیت تا چه زمانی ادامه یابد. گاورز باقیمانده اظهارنظر خود را به بررسی این موضوع اختصاص داد که آیا آرامشی که با شنیدن خبر نقض حدس توسط هوش مصنوعی احساس کرده، موجه بوده یا نه. او کمابیش نتیجه گرفت که موجه بوده، اما در یک پانویس نوشت که حدس می‌زند به زودی هوش مصنوعی به سطح بالایی در فعالیت‌های دیگر مثل ساختن نظریه‌ها، فرموله کردن تعاریف و طرح سؤالات جالب نیز خواهد رسید.

در یک سال گذشته، از سامانه‌های هوش مصنوعی که هنوز در مسابقات ریاضی دبیرستان پیروز نشده بودند، به سامانه‌هایی رسیده‌ایم که می‌توانند ریاضیات را به شکل جالبی پیش ببرند. به نظر می‌رسد سامانه‌های هوش مصنوعی در کار روی مسائل ریاضی به کار خودمختارتر شدن ادامه دهند.

در عین حال، ما هنوز به طور کامل کشف نکرده‌ایم که مدل‌های فعلی در ریاضیات چه توانایی‌هایی دارند. اندکی پس از اعلام OpenAI، شیائو ما، پژوهشگر پسادکترای دانشگاه میشیگان، دریافت که GPT-5.5 نیز اگر یک سرنخ کوچک داده شود، می‌تواند نادرستی حدس اردوش را اثبات کند. اگر یک مدل در دسترس عموم بتواند این حدس مشهور را نقض کند و کسی متوجه نشود، چه اکتشافات دیگری امروز می‌توانند رخ دهند که هیچ کس به فکر امتحان کردن آنها نیفتاده است؟

نظرات کاربرانکپی متنکپی لینک