مرکز تحقیقات کامپیوتری علوم اسلامی(نور) با رونمایی از سامانه هوشمند «تحلیل و توصیف رویدادهای تاریخی»، گامی چشمگیر و تحولآفرین در مسیر دیجیتالسازی و هوشمندسازی پژوهشهای تاریخ اسلام برداشت. این رویداد مهم که صبح سهشنبه ۴ شهریور ۱۴۰۴ برگزار شد، با حضور مقامات و متخصصان برجسته، از جمله حجتالاسلام دکتر محمدعلی رحیمیثابت، مدیر گروه علمی تاریخ، و مهندس علی دانش، مدیر آزمایشگاه هوشمصنوعی مرکز، همراه بود. در این نشست تاریخی اعلام شد که بخش «رویدادها» در پایگاه جامع تاریخ به نشانی tarikh.inoor.ir، اکنون میزبان بیش از ۱۸۰ هزار رویداد تاریخی است که با بهرهگیری از فناوریهای پیشرفته هوشمصنوعی، به دقت جمعبندی و خلاصهسازی شدهاند.
معرفی محصولی نوآورانه در حوزه تاریخ
مرکز تحقیقات کامپیوتری علوم اسلامی (نور) صبح امروز در نشستی که به منظور معرفی نخستین محصول هوشمند خود در حوزه تاریخ برگزار شد، از راهاندازی سامانهای خبر داد که قادر است از مجموعه گسترده گزارشها و منابع تاریخی استخراجشده، خلاصهسازی و توصیف مستند هر رویداد تاریخی را بهصورت ماشینی تولید کند. این ابزار نوین، نویدبخش تحولی عمیق در نحوه دسترسی، تحلیل و تعامل پژوهشگران و عموم مردم با دادههای غنی و پیچیده تاریخ اسلام است.
پیشینه و خاستگاه پایگاه جامع تاریخ
حجتالاسلام دکتر محمدعلی رحیمیثابت، مدیر گروه علمی تاریخ مرکز، در این نشست به سابقه پژوهشی و بنیانهای مستحکم پایگاه جامع تاریخ اشاره کرد و گفت: «پایگاه جامع تاریخ که از سال ۱۳۹۷ در بستر اینترنت عرضه شده است، بر پایه استخراج خطبهخط منابع اصلی تاریخ اسلام و با تمرکز اولیه بر دوره صدر اسلام شکل گرفت.» وی افزود: پژوهشگران مرکز با مطالعه دقیق و موشکافانه منابع اصلی تاریخی – از جمله متون کلاسیک و کهن – رویدادها را استخراج، زمانبندی، مکان و کلیدواژههای مرتبط را ثبت کردهاند و اکنون مجموعهای بینظیر و ارزشمند از دادههای تاریخی در اختیار است که بستر اصلی سامانه جدید را فراهم آورده است.
قلب فناورانه: نقش هوشمصنوعی در پردازش دادهها
مهندس علی دانش، مدیر بخش پردازش هوشمصنوعی مرکز، در توضیح فنی سامانه، ابعاد فناورانه این دستاورد را تشریح کرد. وی اعلام کرد که تیم فنی مرکز مجموعهای عظیم از گزارشهای متمرکز از منابع مختلف (شامل بیش از ۲۷۰ هزار گزارش) را پردازش کرده و با استفاده از مدلهای زبانی بزرگ (Large Language Models) و زیرساخت سختافزاری داخلی قدرتمند، برای بیش از ۱۸۰ هزار رویداد تاریخی، مقالات کوتاه و مستند تولید نمودهاند.
مهندس دانش با تأکید بر دقت، اعتبار و شفافیت خروجیها، تصریح کرد که تولید متنها صرفاً مبتنی بر دادههای در اختیار مرکز انجام شده و مدلها از منابع خارجی «بدون کنترل» تغذیه نشدهاند. وی افزود: «ما بهمنظور کاهش خطا و پدیده توهم (Hallucination) در خروجی مدلها، هر پاراگراف تولیدشده را به منبع اصلی ارجاع دادهایم تا کاربر با یک کلیک ساده بتواند منبع اصلی و اولیه اطلاعات را مشاهده و بررسی کند.» این رویکرد، اطمینان از صحت و قابلیت ردیابی اطلاعات را به بالاترین سطح ممکن میرساند.
قابلیتهای کلیدی و روش کار سامانه جدید
بر اساس توضیحات ارائهشده، سامانه جدید دارای قابلیتهای پیشرفته و کاربردی متعددی است که جستجو، تحلیل و دسترسی به اطلاعات تاریخی را بهینهسازی میکند:
دستهبندی هوشمند رویدادها: امکان دستهبندی رویدادها بر اساس نوع (مانند نظامی، سیاسی، فرهنگی، دینی و غیره)، بازه زمانی مشخص، یا با محوریت یک شخص یا مکان خاص.
جستوجوی محدود و هدفمند: قابلیت محدودسازی جستوجو به دورهها یا افراد خاص و نمایش مجموعه کامل و مرتبط رویدادها با آن محور انتخابی.
تولید شرح رویداد مستند و یکپارچه: استخراج و یکپارچهسازی گزارشهای متعدد از منابع مختلف و تولید یک متن خلاصه، منظم و منسجم بهعنوان «شرح رویداد» که همواره با فهرست کامل منابع ارجاعی همراه است.
مکانیزمهای پردازش پیشرفته داده: شامل فرآیندهای حیاتی برای استانداردسازی تاریخها (تبدیل عبارات تاریخی مختلف و متنوع به تاریخهای مشخص و یکپارچه)، استخراج دقیق اعلام اشخاص و اماکن تاریخی و همچنین برچسبگذاری محتوایی (Content Tagging) برای غنیسازی دادهها.
دسترسی امن و یکپارچه: ارائه دسترسی از طریق زیرساختهای داخلی مرکز و نیز یک درگاه یکپارچه تحت عنوان «جیپیتی» (GPT) برای تسهیل دسترسی به مدلهای زبانی (با رعایت کامل مسائل فنی و امنیتی)، و امکان استفاده از سرویسها با کارتهای داخلی برای کاربران.
زیرساخت و راهبرد فناورانه مرکز
مدیر فنی مرکز درباره زیرساخت این سامانه اظهار داشت که مرکز از ترکیب دو رویکرد استراتژیک بهره میبرد: استفاده از مدلهای متنباز (Open-Source) مستقر بر سرورهای داخلی و استفاده محدود و کنترلشده از سرویسهای خارجی. این راهبرد هوشمندانه، ضمن پاسخگویی مؤثر به نیازهای پژوهشی و فناورانه، مسائل مربوط به محرمانگی دادهها و مدیریت بهینه هزینهها را به بهترین شکل ممکن مدیریت میکند.
تضمین مستند بودن و مقابله با «توهم» هوشمصنوعی
در بخشی مهم از جلسه رونمایی، به یکی از چالشهای اصلی و شناختهشده کاربرد مدلهای زبانی، یعنی پدیده «توهم» (Hallucination) یا تولید اطلاعات غیرمستند و ساختگی، اشاره شد. تیم فنی مرکز برای مقابله با این مسئله حیاتی و تضمین اعتبار علمی خروجیها، روشهای دقیق و چندگانهای را اتخاذ کردهاند که از آن جملهاند:
محدودسازی دامنه ورودی مدلها: مدلهای هوشمصنوعی صرفاً با گزارشها و منابعی تغذیه میشوند که خودِ مرکز پیشتر استخراج، اعتبارسنجی و تأیید کرده است. این رویکرد، از ورود اطلاعات نامعتبر از منابع خارجی جلوگیری میکند.
الزام به ارجاعدهی دقیق: مدل به گونهای طراحی شده است که موظف است هر پاراگراف تولیدشده را به منبع یا منابع مبدأ خود ارجاع دهد. این قابلیت به کاربر امکان میدهد تا با یک کلیک، سند اصلی را مشاهده و صحت مطالب را به صورت مستقل بررسی کند.
بازبینیهای پژوهشی و اصلاحات: در فاز آزمایشی و پیش از بارگذاری عمومی، خروجیهای اولیه سامانه تحت بازبینیهای پژوهشی دقیق و اصلاحات متعدد توسط تیمهای تخصصی قرار گرفتهاند تا بالاترین سطح دقت و مستند بودن تضمین شود.
روند توسعه و برنامههای آینده مرکز نور
مسئولان مرکز اعلام کردند که این رونمایی صرفاً گام نخست در یک مسیر بلندمدت توسعه است و برنامههای توسعهای متعددی در دست اقدام است که افقهای جدیدی را برای آینده پژوهشهای اسلامی ترسیم میکند؛ از جمله:
بهکارگیری مدلهای زبانی بزرگتر: برنامهریزی برای استفاده از مدلهای زبانی بزرگتر و پیشرفتهتر به منظور استخراج مستقیم رویدادها از متون تاریخی خام و غنیسازی هرچه بیشتر پایگاه داده.
توسعه بانک داده اعلام اشخاص و اماکن: توسعه یک بانک داده جامع و منظم از اعلام اشخاص و اماکن تاریخی و اتصال هوشمند آنها به مقالات و رویدادهای مربوطه. این امر به پژوهشگران امکان میدهد تا فهرستهای موضوعی و فردی را بهسادگی و سرعت در اختیار داشته باشند.
طراحی و پیادهسازی سامانه گفتوگوی هوشمند (چتبات تاریخی): طراحی و پیادهسازی یک چتبات تاریخی پیشرفته که کاربران بتوانند بهصورت تعاملی و طبیعی درباره رویدادها سوال کنند و پاسخهای مستند و دقیق دریافت نمایند. این پروژه قرار است با اتصال به سایر سرویسهای هوشمند مرکز، مانند سامانههای حدیث و تفسیر، بخشی کلیدی از «دستیار جامع هوشمصنوعی حوزه علوم اسلامی» را شکل دهد.
گسترش دورهای انتشار محصولات هوشمند: بر اساس اعلام ریاست مرکز، معرفی هر ماه یک محصول هوشمند جدید در رشتههای مختلف علوم اسلامی به صورت مداوم دنبال خواهد شد.
پاسخ به دغدغهها درباره کاربردهای اجتماعی و حکمرانی
در این نشست، یکی از حاضرین سوالاتی را در خصوص کاربردهای احتمالی این فناوری در حوزههای حکمرانی و سیاستگذاری مطرح کرد. حجتالاسلام رحیمیثابت در پاسخ به این دغدغهها، با تأکید بر رسالت اصلی مرکز، تصریح کرد که هدف اصلی مرکز «تسهیل دسترسی پژوهشگران و عموم مردم به منابع اصیل و متون اسلامی» است. وی خاطرنشان ساخت که تولیدات مرکز با رویکرد کاملاً پژوهشی و مستند برای استفاده علمی و آموزشی عرضه میشود. ایشان افزودند که مرکز بستر و دادههای اصیل را در اختیار محققان میگذارد و قضاوت در مورد کاربردهای اجتماعی یا سیاستگذاری بر عهده دستگاههای ذیربط و نخبگان علمی جامعه است.
نکات تکمیلی و دسترسی کاربران
مسئولان مرکز یادآور شدند که فرایند تجمیع و افزودن دادهها به پایگاه جامع تاریخ همچنان ادامه دارد و در حال حاضر تیمی متشکل از پژوهشگرانِ تخصصی (طلبه و تاریخپژوه) به صورت مستمر بر استخراج، اعتبارسنجی و غنیسازی رویدادها کار میکنند. کاربران علاقهمند میتوانند شرح رویدادها و مقالات کوتاه تولیدشده توسط سامانه هوشمند را در بخش «رویدادها» پایگاه جامع تاریخ به نشانی tarikh.inoor.ir مشاهده و از آن بهرهبرداری کنند.
این ابتکار فناورانه، مرکز تحقیقات کامپیوتری علوم اسلامی (نور) را به عنوان یکی از پیشگامان نوآوری در پژوهشهای تاریخ اسلام در سطح ملی و بینالمللی معرفی میکند و افقهای جدیدی را برای محققان، دانشجویان و عموم علاقهمندان به این دوره غنی و پرفراز و نشیب از تاریخ بشریت میگشاید.