به گزارش لیزنا، نشست «رویکرد استانداردهای فرادادهای به ثبت روابط معنایی» در تاریخ 4 بهمن 1403 به صورت حضوری و مجازی برگزار شد. دکتر طاهری با اشاره به انواع استانداردهای بافت میراث فرهنگی گفت: استانداردهای فرادادهای مانند یک ظرف خالی بوده و در یک بافت خاص توسعه مییابند. این نوع از استانداردها متناسب با نیازهایی که در آن بافت وجود دارد، ساختار و شکل خاصی به خود گرفته و صفات توصیف یک یا چندین شیء را تعیین میکنند. از آنجایی که استانداردهای فرادادهای به تعیین ساختارها میپردازند، دادهای که توسط آنها ایجاد میشود یک داده ساختارمند (Structured data) به شمار میآید. استانداردهای محتوایی به ثبت ارزشها (Value) پرداخته و به دو پرسش چه بنویسیم (What to Write?) و چگونه بنویسیم (How to Write?) پاسخ میدهند. بدین ترتیب، ساختار توصیفی که توسط استانداردهای فرادادهای ارائه میگردد، با استانداردهای محتوایی تکمیل میشود. به همین دلیل، این دو استاندارد باید سازگار و مکمل یکدیگر عمل نمایند تا بتوانند به خوبی کار توصیف را انجام دهند. به بحث ثبت روابط در هر دو نوع استاندارد پرداخته شده است و باید از استانداردهای فرادادهای و محتوایی را توأمان بهمنظور برقراری پیوند بین موجودیتها به کار برد. در این خصوص لازم به ذکر است روابط در استانداردهای فرادادهای درج میشوند و چگونگی ثبت روابط و استفاده از واژهها و عبارات (نشانگرهای) مناسب برای برقراری پیوند با استفاده از استاندارد محتوایی تعیین میگردد. در اصل، استانداردهای محتوایی واژهها یا عبارتهایی را تبیین میکنند که براساس دستورالعملهایی خاص نوع رابطه را نشان داده و آنها را در صفات فرادادهای ثبت میکنند. اما در اصل آن چیزی که موجودیتهای دادهای را با یکدیگر پیوند میدهد و ارتباط برقرار میکند، استاندارد فرادادهای است.
در ادامه، بهمنظور دستیابی به درکی مناسب از رویکردهای برقراری ارتباط بین موجودیتها مروری بر روی استانداردهای فرادادهای انجام شد و رویکردهای گوناگون استانداردها تبیین شد. در این خصوص دکتر طاهری افزود: هر موجودیت از ترکیب و ادغام صفات (ویژگیها و روابط) به وجود میآید و رویکردی که اکنون در استانداردهای نوین مدنظر است، این است که هر آنچه وجود دارد رابطه است و صفات به صورت ویژگی ثبت نمیشوند. در دادههای پیوندی نیز ما ویژگی نداریم و همه صفات یک شیء به صورت رابطه ثبت میشوند. در عالم واقعی نیز به همین گونه است. در سامانه ثبت آردیاِی (RDA Registry) نیز که در قالب دادههای پیوندی پیاده شده است، همه صفات به رابطه تبدیل شدهاند و صفتی به صورت ویژگی نداریم.
در ادامه، دکتر طاهری با اشاره به شیوههای ثبت روابط در استانداردهای گوناگون عنوان کرد: دو شیوه برای ثبت روابط وجود دارد. در استانداردهای سنتی همانند یونیمارک بلوک 4 به ثبت روابط بین منابع اختصاص یافته بود؛ اما این بلوک رابطهای فقط روابط بین دو منبع را نشان داده و رابطه سلسله مراتب یک شیء، روابط بین عاملها با منابع و روابط عاملها با یکدیگر را نشان نمیداد. دلیل این مسئله رویکرد متفاوت مارک در ثبت روابط بود. بهطور نمونه، در بلوک 4 یونیمارک ارتباط بین فروستها مانند رابطه توالی، نیز رابطه کل/جزء، روابط مربوط به پیایندها، ویرایشهای مختلف، رابطه اشتقاقی (مثل ترجمهها و اقتباسها)، رابطه همارز، بازتولیدها، نقدها و جز آنها با خود منبع تعیین میشد. در یونیمارک برای بیشتر این روابط فیلد جداگانهای اختصاص یافته بود و در آن فیلد فقط آن نوع رابطه را میتوانستیم ثبت کنیم. این رویکرد را در برخی دیگر استانداردها هم مشاهده میکنیم. به طور مثال، فرانمای تولید دادههای ساختارمند (schema.org) هر یک از روابط را به صورت صفت مستقل آورده است و صفاتی مثل بخشی است از( isPartOf)، براساس (isBasedOn)، قابل دسترس است از طریق (isAccessibleForFree) و جز آنها صفات رابطهای هستند که هر یک به صورت یک صفت مستقل ثبت میشوند.
سپس، دکتر طاهری با اشاره به رویکرد دوم به ثبت روابط در استانداردها گفت: در رویکرد دوم استانداردهایی همانند استاندارد مودس (MODS) را داریم. این استاندارد در ثبت روابط خیلی خوب کار کرده است. مودس بیست عنصر دارد که یکی از آنها به نام مورد مرتبط (relatedItem) است. در توصیف این صفت بیان شده است که relatedItem شامل دادههایی است که دیگر منابع مرتبط با شیء در دست توصیف را شناسایی میکند. این صفت 20 عنصر فرعی (Sub-element) نیز دارد. بدین معنا که دقیقاً از طریق 20 عنصری که در خود مودس وجود دارند، میتوان بین یک پیشینه مودس با دیگر پیشینهها ارتباط برقرار کرد. به عبارتی دیگر، بهطور دقیق میتوان مشخص کرد بین دو پیشینه مودس کدام صفات از جمله عنوان (title)، نام (name)، نوع منبع (typeOfResource) و جز آنها با یکدیگر مرتبط هستند. در این زمینه در رویکردی جدیدتر، در بیبفِریم با استفاده از سه عنصر relatedTo، relation و relationship روابط بین موجودیتها را برقرار میکند. صفت relatedTo نشانگر هر رابطهای بین اثر، نمونه، مورد و رویداد به صورت متقابل و قرینه (reciprocal) است. با استفاده از این صفت میتوان دو سطح رابطه اولیه (primary relationship) و رابطه ثانویه (secondary relationship) بین منابع برقرار کرد. رویکرد بیبفِریم به این صورت است که یک صفت به نام relatedTo دارد و انواع گوناگون روابط همانند نمونهای دارد (hasInstance)، اشتقاقی دارد (hasDerivative)، همارزی دارد (hasEquivalent) و جز آنها را بین منابع تعیین میکند.
وی افزود: بیبفِریم دو صفت دیگر نیز دارد که اینها نیز به روابط میپردازند. صفت relation به شناسایی منبع همبسته (Associative resource) و نوع ارتباط آن با منبع در دست توصیف میپردازد. رابطه فروست (Series) با عنوانی که در آن فروست قرار گرفته است، در این صفت ثبت میشود. و دیگر، صفت relationship در بیبفِریم مطرح است که همراه با صفت relation استفاده شده و رابطه یک منبع با فروست و یا یک مجموعهها (collections) را مشخص میکند. استاندارد هسته دابلین نیز صفت relation را داشت که بیشتر ترجیحش این بود که از رشته ارزش و یا عددی برای برقراری پیوند استفاده کند. این رویکردها را در ثبت روابط داریم و همان طور که پیشتر نیز اشاره گردید، فراداده این روابط را برقرار میکند.
سپس، دکتر طاهری با اشاره به چالشهای رویکردهای پیشین افزود: در رویکرد مارک که یک رویکرد سنتی بود و ما این رویکرد را در Schema.org هم مشاهده میکنیم. دو نقص وجود دارد: نخست، روابط بین سطوح سلسله مراتب یک شیء (Hierarchy of object) یعنی اثر، بیان، نمود و مورد (WEMI) که نخستین نوع رابطه است و سطوح سلسله مراتبی یک شیء را نشان میدهد، در رویکرد پیشین مدنظر قرار نگرفته است. این در حالی است که این نوع رابطه بسیار مهم است و هر موجودیتی در این چهار بعد با موجودیتهای دیگر مرتبط است. دیگر ایراد رویکرد سنتی این است که برای هر فیلد یک رابطه اختصاص داده و هر فیلد یک نوع رابطه را نشان میدهد. در اسکیما هر رابطهای یک صفت مجزا دارد. حال پرسشی که مطرح میشود این است: وقتی تعداد روابط زیاد است چه کار کنیم؟ یعنی همه اینها را در صفات جداگانه در پروفایل یا کاربرگه (Worksheet) بیاوریم؟ اکنون که آردیاِی حدود 900 رابطه دارد، باید همه آنها تکرار شوند؟ ممکن است این پاسخ به نظر برسد که ما در نظامهای مدیریت داده امکان worksheet generator را داریم و تنظیم میکنیم کدام صفات را بیاوریم. اما شایان توجه است که در خصوص صفات رابطهای خیلی نمیتوان این شیوه را به کار برد؛ چرا که ما نمی دانیم یک منبع با دیگر منابع چه نوع رابطهای دارد. منابع به صورت بالقوه میتوانند هر نوع رابطهای با یکدیگر داشته باشند. پس در عمل باید یک worksheet خیلی مفصلی داشته باشیم.
وی در ادامه گفت: در گسترش bib.schema.org که گسترش کتابشناختی اسکیما است نیز همین چالشها مشاهده میشود. در این گسترش تعدادی از موجودیتهای بافت کتابشناختی مانند اطلسها، کتابهای صوتی، فصلهایی از کتاب، مجموعهها و جز آنها در نظر گرفته شدهاند و برای آنها تعدادی صفت مانند خلاصهشده (abridged) و یا در پشتیبانی از (inSupportOf)، ترجمه اثر (translationOfWork)، خوانده شده توسط (readBy)، منتشر شده توسط (publishedBy) مطرح شدهاند. در این گسترش نیز چالشهایی که پیشتر اشاره گردید، قابل مشاهده است. نکته حائز اهمیت این است که در این گسترش در کنار رابطه بین منابع (resource to resource) روابط عاملها با منابع (resource to agent) نیز ثبت شدهاند. با توجه به اینکه در گسترش bib.schema.org روابط بین عاملها و منابع را نیز مورد توجه قرار داده است، افزون بر بیش از 900 نشانگری که در پیافزودهای J و M آردیاِی وجود دارند، باید بیش از 400 نقشدهنده (Relator) را برای ثبت روابط بین عاملها و منابع بیفزاید. بدین ترتیب شمار صفاتی که باید در این گسترش گنجانده شوند حدود 1400 صفت است.
چالش دیگری که در این زمینه مطرح است چگونگی ثبت محتوا و ارزشها در صفات یادشده است؛ چرا که خود نام صفت نشانگر رابطه است و این در ثبت محتوا مشکل آفرین است حتی اگر از روش دادههای پیوندی استفاده شده باشد. این در حالی است که در مودس صفت relatedItem، در بیبفِریم صفت relatedTo و در آردیاِی پیافزودها را با هدف ثبت روابط ارائه شدهاند. بهطور نمونه، درآردیاِی که نشانگرهای رابطهای را برای ثبت روابط به کار میبرد، این مشکل وجود ندارد. در اصل، نشانگر یک صفت است (بیشتر یک صفت فرعی) است که برخلاف رویکرد پیشین، مشکل ثبت ارزشها وجود ندارد و امکان پیونددهی منابع با یکدیگر تسهیل میگردد.
عضو هیأت علمی دانشگاه علامه طباطبایی افزود: ما دقیقا یک سیر تحولی را که براساس نیازهای بافت خاص بوده است را مشاهده میکنیم. نخست، اختصاص فیلد یا صفت مجزا البته به صورت ناقص را داشتیم که همه انواع روابط را پوشش نمیداد. در رویکرد دوم، استانداردهایی همانند مودس به تعداد تمام عناصر یک عنصر فرعی افزوده شد. در رویکرد پسین همه عناصر فرعی که در استانداردهایی همانند مودس وجود داشتند، به نشانگر تبدیل شدهاند.
در ادامه، دکتر طاهری با اشاره به بهترین رویکرد و شیوه ثبت روابط گفت: در رویکرد جدید که مبتنی بر آردیاِی است، بهترین رویکرد ثبت روابط و مدل تکامل یافته همه رویکردهای پیشین را داریم که افزون بر ایجاد انسجام و یکدستی موجب انعطافپذیری در ثبت روابط میشود. حتی در بیبفِریم نیز مشکل داشتیم که همانند مودس صفات فرعی دارد و چگونگی ثبت دیگر روابط مشخص نیست. هرچند بیبفِریم به جای همه استانداردهای پیشین همانند مودس، متس و غیره آمده و جایگزین همه آنها شده است؛ چراکه از همه کارکردهای حوزه فراداده پشتیبانی میکند. اما بیبفِریم تا حدود زیادی از لحاظ ثبت روابط باز مشابه مودس عمل کرده است.
در ادامه دکتر طاهری با اشاره به سیر تکامل استانداردهای فرادادهای گفت: در سیر تکامل استانداردهای فرادادهای ما چندین نسل را داشتیم. یک نسل از استانداردها مبتنی بر پایگاه داده (database-based) بودند مثل مارک که از نظر بستر نحوی، مبتنی بر قالب محلی پایگاه داده بود. نسل دوم استانداردها مبتنی بر بستر نحوی ایکسامال بودند (XML-based) که مارک ایکسامال (MARC/XML)، مودس (MODS)، متس (METS)، مدس (MADS)، و میکس (MIX) در این دسته قرار دارند. نسل پسین، استانداردهای همانند بیبفِریم بودند که به جای زبانهای نشانهگذاری ماشینخوان به سمت زبانهای نشانهگذاری ماشینفهم همانند آردیاِف و جیسان حرکت کردهاند.
وی افزود: در رویکرد نوین پیوستهای آردیاِی و دیگر روابط مورد نیاز، در قالب واژگان (Vocabulary) حتی به صورت جداگانه و تفکیکشده در سیستم ثبت شده و به یک منبع اختصاص مییابند. این رویکرد امکان انعطافپذیری را فراهم میکند. هر رابطه جدیدی هم که لازم باشد، میتوان در یک نظام مبتنی بر هستیشناسی (Ontology-based) بافتهای گوناگون تعریف کرد. از سوی دیگر، حتی برخی صفات را میتوان به صورت محلی (Local) به واژگان افزود. ممکن است در یک بافت خاص تعدادی رابطه وجود داشته باشند که در جای دیگر لازم نیستند و به طور ویژه در یک بافت کشف شدهاند و ثبت آنها ضروری است. استفاده از نشانگرهای رابطهای در سیستم بهترین روش برای طراحی است و کاملا دست ما را باز میگذارد که بین موجودیتها انواع گوناگون روابط را برقرار کنیم.
دکتر طاهری به چگونگی ثبت روابط در سیستمهای مدیریت داده پرداخت و گفت:: روابط اولیه یک منبع که به صورت سلسله مراتب شیء ثبت میشوند را سامانههای مبتنی بر الآرام (LRMized) به صورت خودکار پشتیبانی میکنند. روابط اولیه بین منابع در سیستم مشخص میشوند و نیازی نیست مشخص کنیم، نمود یک اثر چیست و یا مورد یک نمود کدام یک است. خود سامانه اگر مبتنی بر الآرام باشد این نوع روابط را پشتیبانی میکند. یکی از روشهایی که میتوانیم تشخیص بدهیم یک سامانه LRMized است یا خیر؟ این است که به چگونگی ثبت روابط اولیه توجه کنیم. اگر مبتنی بر الآرام نباشد، بهطور مثال در یک سامانهای که استاندارد فرادادهای آن مارک است، برای اینکه بتوانیم الآرام را پیادهسازی کنیم، باید در فیلدهای رابطهای مشخص کنیم که اثر و یا نمود یک شیء چیست؛ چرا که خود سامانه قابلیت بازنمود ساختار سلسله مراتبی شیء را ندارد. سامانهای که مبتنی بر الآرام پیادهسازی شده است، نیازی به ثبت این روابط از سوی فهرستنویس نیست و خود سامانه این نوع روابط را شامل میشود و اگر بخواهیم یک اثر را ثبت کنیم باید نمود آن را هم ثبت کنیم و یا در توصیف یک نمود باید اثر آن را تعیین نماییم. این معیاری بسیار مناسب برای این است که دریابیم یک سامانه مبتنی بر الآرام است یا خیر؟. برای ثبت روابط بین منابع از صفت relatedto استفاده میشود. در این صفت میتوان به دلیل گستردگی تعداد روابط از نشانگرهای آردیاِی بهره گرفته و روابط اولیه و ثانویه منابع را مشخص کرد.
سپس، دکتر طاهری در خصوص تعیین صفات رابطهای گفت: ما نشانگرهای رابطهای را در صفاتی که قرار است، رابطهای خاص را پشتیبانی کنند، ثبت میکنیم. بهطور نمونه در صفت پدیدآورنده که میخواهیم نقش اختصاص بدهیم، از نشانگرها استفاده میکنیم. مارک اصطلاحا به آنها نقشدهنده (relator) میگوید که نقشها را مشخص میکند و این نقشها رابطه عامل (پدیدآورنده، ناشر و جز آنها) را با منبع نشان میدهند. به این نقشدهندهها و نشانگرها گویاسازی روابط گفته میشود. این ابزارها نوع روابط را نشان داده، و پایه و اساس توسعه هستیشناسیها هستند. هستیشناسیها بدین منظور توسعه مییابند تا وجود رابطه و نوع روابط را بین موجودیتهای گوناگون بازنمود کنند. بهطور مثال، نشان میدهند یک شخص عضوی از یک سازمان است و نوع رابطهای که با آن دارد «فارغالتحصیلی» است.
وی در ادامه با بیان چگونگی ثبت روابط بین عاملها گفت: در رویکردهای پیشین رابطه بین عاملها و منابع در بایگانیهای مستند ثبت میشدند که تمرکز آنها صرفا بر روی نامهای موجودیتهای عامل بود. در حالی که در استانداردهای جدید برای خود موجودیت عامل، و نه فقط نام آنها، یک پروفایل منحصر به فرد ایجاد میشود. در روزآمدسازی بیبفِریم نیز همین مسئله مدنظر بوده و در بیبفِریم 2.0 حذف موجودیت مستندات را شاهد هستیم. ساختار بیبفِریم 1.0 بدین گونه بود که موجودیتهای اثر، نمونه، مستندات و گزارهمان را شامل میشد. اما در نسخه دوم آن موجودیت مستندات حذف شده و موجودیتهایی همانند شخص، سازمان، مکان و هر آن چیزی که دارای نام است، به صورت موجودیتهای عالم واقعی بازنمود میشوند؛ چرا که این موجودیتها فراتر از یک نام هستند. تمرکز مستندات بر روی نام موجودیت است. در حالی که ما خود موجودیت را به صورت جداگانه داریم. یک موجودیت افزون بر نام صفات مهم دیگری نیز دارد که لازم است توصیف شوند. حال وقتی بخواهیم یک شخص را به یک سازمان پیوند بدهیم. باید برای شخص و سازمان پروفایل خاص ایجاد کرده و سپس آن شخص را به سازمان مرتبط پیوند دهیم. بدین ترتیب برای ثبت روابط بین عاملهای گوناگون برای هر عامل باید پروفایل جداگانهای ایجاد شود و آن پروفایلها را به یکدیگر ربط دهیم. نام سازمان و موجودیت مرتبط نیز بر اساس فرانمای رمزگذاری واژگان (از جمله مستندات) ثبت میگردد. افزون بر رویکرد بیبفریم در حذف موجودیت مستندات، در آردیاِی نیز عاملها به صورت موجودیتهای مجزا در نظر گرفته میشوند و در الآرام نیز موجودیت نامنما (Nomen) به نامهای موجودیتها میپردازد و از خود شخص که موجودیتی مستقل است، تفکیک شده است. در سیستمهای هستیشناسانه اگر بخواهیم بهطور کامل براساس استاندارد عمل کنیم، باید در ثبت صفت پدیدآورنده، پروفایل خود شخص را با همه صفاتی که دارد به منبع پیوند بدهیم. البته که برای ثبت نام شخص از مستندات بهره میگیریم و نقشی را که آن شخص در ارتباط با منبع دارد، تعیین میکنیم. یک شخص ممکن است نقشهای متفاوتی در منابع گوناگون داشته باشد و بهتر است در خود منبع تعیین کنیم یک شخص در آن اثر چه نقشی دارد و سپس نوع رابطه را تعیین کنیم.
در بخش پایانی جلسه نیز به پرسشهای حضار پاسخ داده شد. ششمین جلسه از این دوره به بحث انسجام بین استانداردهای فرادادهای و محتوایی در ثبت روابط اختصاص خواهد یافت.
گزارش: نگین شکرزاده هشترودی