روبات پویشگر هرمس در یک نگاه کلی مطابق ساختاری که در شکل نشان داده شده است طراحی شده است. برخی از قابلیتهای ویژهٔ این پویشگر در ادامه آمده است.
- قابلیت دریافت هرگونه محتوا اعم از: HTML, RSS, IMAGE, MOVIE, ...
- قابلیت رصد اخبار جدید به صورت آنی و ذخیرهسازی آنها در صورت جدید بودن
- امکان ذخیرهٔ تغییرات اعمالشده روی اخبار پس از انتشار. به بیان دیگر هرمس مانند بسیاری از روبوتهای هوشمند قابلیت ذخیرهٔ تاریخچهای از تغییراتی که روی هر خبر اعمال میشود را دارد.
- تشخیص حذف یک خبر از روی خروجی خبرگزاری. هرمس میتواند به صورت روزانه گزارشی از خبرهایی که هر خبرگزاری از خروجی خود حذف کرده است ارائه دهد. هرمس به حذف خبر از جانب خبرگزاریها احترام میگذارد و در صورت تشخصی حذف، آنرا از روی خروجی صاحبخبر نیز حذف خواهد کرد.
- تحلیل صرفی افعال و اسامی در زبان فارسی به هنگام نمایهسازی
- فابلیت استخراج عنوان خبر، روتیتر و زیرتیتر خبر، لید خبر، بدنهٔ خبر، کلمات کلیدی، سرویس خبری، عکسهای خبر، سازندهٔ خبر، تاریخ انتشار خبر.
- هرمس بر خلاف دیگر نمونههای داخلی و خارجی قابلیت استخراج زمان دقیق «انتشار خبر» را از خروجی خبرگزاریها دارد. نرمافزارهای مشابه صرفاً میتوانند زمان دریافت خبر را ذخیره کنند و یا زمان انتشار را از روی RSS استخراج کنند، در حالی که هرمس برای استخراج زمان انتشار خبر نیازی به RSS ندارد و میتواند آنرا از تاریخ درج شده در کنار هر خبر استخراج کند.
- احترام به سرورها: هرمس به هیچ عنوان بار اضافیای بر سرورهای خبری تحمیل نمیکند.
- استخراج جایگاههای خبری: هرمس میتواند خبرهایی که در تیتر یک، تیتر دو، تیتر سه، پیشنهاد سردبیر، پربازدید، پربحث و ... هر خبرگزاری آمده است را تشخیص دهد و جایگاه مبدأ آنرا ذخیره کند.