ربات خبرخوان هرمس - HermesBot

دیاگرام روبات هرمس هرمس یک ربات پویشگر وب است که در حال حاضر برای دریافت و نمایه‌سازی اخبار طراحی شده، اما قابلیت دریافت و ذخیرهٔ هرگونه محتوای دیجیتالی را داراست.

صاحب‌خبر -

روبات پویشگر هرمس در یک نگاه کلی مطابق ساختاری که در شکل نشان داده شده است طراحی شده است. برخی از قابلیت‌های ویژهٔ این پویشگر در ادامه آمده است.

  1. قابلیت دریافت هرگونه محتوا اعم از: HTML, RSS, IMAGE, MOVIE, ...
  2. قابلیت رصد اخبار جدید به صورت آنی و ذخیره‌سازی آن‌ها در صورت جدید بودن
  3. امکان ذخیرهٔ تغییرات اعمال‌شده روی اخبار پس از انتشار. به بیان دیگر هرمس مانند بسیاری از روبوت‌های هوشمند قابلیت ذخیرهٔ تاریخچه‌ای از تغییراتی که روی هر خبر اعمال می‌شود را دارد.
  4. تشخیص حذف یک خبر از روی خروجی خبرگزاری. هرمس می‌تواند به صورت روزانه گزارشی از خبرهایی که هر خبرگزاری از خروجی خود حذف کرده است ارائه دهد. هرمس به حذف خبر از جانب خبرگزاری‌ها احترام می‌گذارد و در صورت تشخصی حذف، آن‌را از روی خروجی صاحب‌خبر نیز حذف خواهد کرد.
  5. تحلیل صرفی افعال و اسامی در زبان فارسی به هنگام نمایه‌سازی
  6. فابلیت استخراج عنوان خبر، روتیتر و زیرتیتر خبر، لید خبر، بدنهٔ خبر، کلمات کلیدی، سرویس خبری، عکس‌های خبر، سازندهٔ خبر، تاریخ انتشار خبر.
  7. هرمس بر خلاف دیگر نمونه‌های داخلی و خارجی قابلیت استخراج زمان دقیق «انتشار خبر» را از خروجی خبرگزاری‌ها دارد. نرم‌افزارهای مشابه صرفاً می‌توانند زمان دریافت خبر را ذخیره کنند و یا زمان انتشار را از روی RSS استخراج کنند، در حالی که هرمس برای استخراج زمان انتشار خبر نیازی به RSS ندارد و می‌تواند آن‌را از تاریخ درج شده در کنار هر خبر استخراج کند.
  8. احترام به سرورها: هرمس به هیچ عنوان بار اضافی‌ای بر سرورهای خبری تحمیل نمی‌کند.
  9. استخراج جایگاه‌های خبری: هرمس می‌تواند خبرهایی که در تیتر یک، تیتر دو، تیتر سه، پیشنهاد سردبیر، پربازدید، پربحث و ... هر خبرگزاری آمده است را تشخیص دهد و جایگاه مبدأ آن‌را ذخیره کند.