به گزارش ایسنا به نقل از روابط عمومی سازمان اسناد و کتابخانه ملی ایران، سامانه پردازش خودکار با هدف استخراج فرادادههای متادیتای توصیفی از قبیل عنوان، ناشر و نام پدیدآورنده و غیره از طریق هوش مصنوعی در سازمان اسناد و کتابخانه ملی ایران با حضور مهدی محمدی، دبیر ستاد توسعه فناوریهای اقتصاد دیجیتال و هوشمندسازی معاونت علمی و فناوری ریاست جمهوری، بهروز مینایی، دانشیار گروه هوش مصنوعی، رباتیک دانشگاه علم و صنعت، علیرضا نوروزی، دانشیار گروه علم اطلاعات و دانششناسی دانشگاه تهران، مظفر پاسدار شیرازی، معاون توسعه مدیریت و منابع و سرپرست حوزه دیجیتال و علیرضا انتهایی، مدیرکل پردازش منابع دیجیتال در محل اندیشگاه سازمان اسناد و کتابخانه ملی ایران رونمایی شد.
علیرضا انتهایی، مدیرکل پردازش منابع دیجیتال در توضیح راهاندازی این سامانه گفت: سامانه پردازش خودکار به منظور استخراج عناصر برای جستوجوی اطلاعات راهاندازی شده است که در کتابها و منابع فیزیکی به آن فهرستنویسی میگویند. این فرآیند از گذشته در کتابخانههای دنیا انجام میشد، اما امروز با وجود کتابخانههای هوشمند از آن به عنوان متادیتا یاد میشود.
وی به اهداف راهاندازی این سامانه اشاره کرد و گفت: سازمان اسناد و کتابخانه ملی ایران با طراحی و راهاندازی این سامانه در تلاش است، فرادادههای توصیفی از قبیل عنوان، ناشر و نام پدیدآورنده و غیره را از طریق هوش مصنوعی استخراج کند و در نهایت نیروی انسانی فقط نقش نظارتی دارد و در این فرآیند از هوش مصنوعی و یادگیری عمیق ماشینی استفاده شده است.
مدیرکل پردازش منابع دیجیتال سازمان اسناد و کتابخانه ملی ایران سپس اظهار کرد: هوش مصنوعی یک فرایند یادگیری ادامهدار است که با بهرهگیری از این امکان، سامانه پردازش خودکار سازمان اسناد و کتابخانه ملی ایران در ادامه مسیر به مرور از دقت بیشتری نیز برخوردار خواهد شد.
انتهایی همچنین به فرآیند و کارکردهای این سامانه اشاره کرد و افزود: این سامانه نسخه دیجیتال پایاننامه را از طریق سامانه نویسهخوان(OCR) به متن تبدیل میکند و در گامهای بعدی هوشمندانه فرادادههای توصیفی در منابع اطلاعاتی را بر اساس استانداردهای تعریفشده استخراج میکند. دقت بهکار گرفتهشده در این سامانه شاید هماکنون عدد قابل ملاحظهای در حوزه منابع توصیفی باشد به گونهای که در خصوص پایاننامهها حدود ۸۰ درصد دقت استخراج فراداده و ۹۵ درصد صحت اطلاعات استخراجشده رسیده است، این سازمان در تلاش است این مهم را درباره کتاب و مقاله نیز توسعه دهد.
مدیرکل فراهمآوری و پردازش منابع دیجیتال سازمان اسناد و کتابخانه ملی ایران ادامه داد: سرعت این سامانه با توجه به زیرساختهای موجود حدود دو مدرک در دقیقه است، البته این امر با تقویت زیرساخت میتواند افزایش یابد.
انتهایی ضمن قدردانی از حمایتهای معاونت علمی و فناوری ریاست جمهوری در فراهمسازی زیرساخت پردازش خودکار، یادآور شد: قابلیتهای دیگری نیز در سامانه دیجیتال سازمان افزوده شده است که میتوان به قابلیت جستوجوی معنایی به کمک نمودار گرافیکی اصطلاحنامه اصفا اشاره کرد.
مظفر پاسدار شیرازی، معاون توسعه مدیریت و منابع انسانی و سرپرست معاونت دیجیتال سازمان اسناد و کتابخانه ملی ایران نیز ضمن قدردانی از حمایتهای مادی و معنوی صورتگرفته از سوی معاونت علمی و فناوری ریاست جمهوری در راهاندازی این سامانه گفت: ظرف یکسال گذشته با کمک پنجره واحد نشر فهرست ۱۰۰ درصد کتابهای کشور پیش از انتشار توسط متخصصان پردازش سازمان اسناد و کتابخانه ملی ایران تولید میشود، نکتهای که پیش از این حدود ۹۰ درصد بود. به بیان دیگر پردازش کتاب از منظر کمی تکمیل شده است. این پروژه و سایر پروژههای حوزه نوآوری سازمان ذیل عنوان پردازش خودکار تلاش دارد تا نخست سرعت و دقت فرایندهای پردازش منابع ورودی سازمان را افزایش دهد و در ادامه به ارتقای کیفیت فهرست تولیدی سازمان نیز کمک کند.
معاون توسعه مدیریت و منابع سازمان اسناد و کتابخانه ملی ایران ادامه داد: در تلاش هستیم در حوزه فهرستنویسی توصیفی و فهرستنویسی تحلیلی از فناوریهای جدید استفاده کنیم، در این بین کیفیت متادیتای تولیدی در این حوزه نقش و جایگاه ویژهای دارد به طوری که در نهایت با استفاده از این ابزار همه کتابخانههای کشور به یک متادیتای سریعتر، بهروزتر و با کیفیت بالاتری دسترسی خواهند داشت.
او گفت: یک پروژه موازی دیگر با این امر نیز برای فهرستنویسی تحلیلی با کمک استارتاپها و شرکتهای فناوری در سازمان اسناد و کتابخانه ملی ایران در حال انجام است که در نهایت سامانه با کمک هوش مصنوعی با بررسی متن کتاب ارائهشده پیشنهاد ردهبندی کتاب را بر اساس استاندارد کتابخانه کنگره به متخصصان فهرستنویس ما پیشنهاد میدهد و فهرستنویسان سازمان اسناد و کتابخانه ملی ایران این پیشنهادات را ارزیابی و انتخاب میکنند.
او ادامه داد: سازمان اسناد و کتابخانه ملی ایران در راستای خدماتی که از شرکتهای فناور میگیرد در تلاش است خدمات مورد نیاز این شرکتها را نیز تامین کند، چرا که یکی از دلایل عدم توسعه هوش مصنوعی در زبان فارسی نبود بیگ دیتا در زبان فارسی است؛ دادههای کتابخانه ملی به مثابه یک فلز گرانبها در معدن است که برای بهرهبرداری فناوران نیاز به استخراج و آمادهسازی دارد.
معاون توسعه مدیریت و منابع سازمان اسناد و کتابخانه ملی ایران خاطرنشان کرد: نگاه سازمان اسناد و کتابخانه ملی ایران تا به امروز سرویسدهی و ارائه خدمات به پژوهشگران بوده اما امروز در تلاش است دادههای موجود در این سازمان را به فعالان عرصه هوش مصنوعی کشور نیز ارائه دهد تا این عزیزان بتوانند خدمات متنوعی را به کشور و جامعه فارسیزبان ارائه دهند.
همچنین مهدی محمدی، دبیر ستاد توسعه فناوریهای اقتصاد دیجیتال و هوشمندسازی معاونت علمی و فناوری ریاست جمهوری گفت: تحول فناورانه در سازمان اسناد و کتابخانه ملی ایران برای فعالان حوزه هوش مصنوعی غنیمت است و میتواند نقش ویژهای را برای شکلگیری تکنولوژیهای جدید توسط استارتاپها ایفا کند.
دبیر ستاد توسعه فناوریهای اقتصاد دیجیتال و هوشمندسازی معاونت علمی و فناوری ریاست جمهوری ادامه داد: در حال حاضر فرصتها در حوزه هوشمندسازی کوتاه است و هیچ یک از کشورها فرصت عقب ماندگی و تقلید را ندارند. کشورها باید از این امکان تا سال ۲۰۳۵ بهره لازم را برده باشند و حرفی برای گفتن داشته باشند.
محمدی سپس با بیان اینکه بهرهمندی از هوش مصنوعی امروزه برای کشورها انتخاب نیست بلکه یک ضرورت است گفت: بهرهمندی از دیتا در هوش مصنوعی به منزله امکانی ویژه در دنیای امروز است. سازمانهایی که دیتا دارند امروز ثروتمند هستند و نمونه بارز این امر سازمان اسناد و کتابخانه ملی ایران است. این سازمان بهخوبی در مسیر بهرهمندی از دیتاهای موجود خود قرار گرفته است و تصمیم ندارد تا انباشتی از داده درست کند و این اطلاعات را نگاه دارد.
او خاطرنشان کرد: بهرهمندی از این دیتاها زمینه ظهور و بروز استارتاپهای مختلف را فراهم میکند به طوری که حتی این مهم میتواند برای سازمان اسناد و کتابخانه ملی ایران ثروت به همراه باشد.
در ادامه این مراسم بهروز مینایی، دانشیار گروه هوش مصنوعی و رباتیک دانشگاه علم و صنعت با اشاره به اهمیت راهاندازی سامانه پردازش خودکار گفت: ارتباط سازمان اسناد و کتابخانه ملی ایران با دنیای هوش مصنوعی و فناوری متحول شده است.
مینایی به اهمیت و جایگاه هوش مصنوعی در جهان امروز اشاره کرد و افزود: هماکنون بسیاری از کشورهای دنیا از جمله آلمان حمایتهای ویژهای را از استارتاپها به منظور پیشبرد فرآیندهای هوش مصنوعی صورت میدهند.
او همچنین بیان کرد: سازمان اسناد و کتابخانه ملی ایران غنیترین جایگاه برای کتاب، سند و تاریخ شفاهی است ضمن اینکه این سازمان منبعی برای فعالیتهای هوش مصنوعی به شمار میرود؛ با استفاده از ابراطلاعاتی که سازمان اسناد و کتابخانه ملی ایران از اسناد سالهای متمادی به وجود میآورد میتوان مجموعهای غنی ایجاد کرد، این مجموعه بیتردید سرچشمه بسیاری از پروژههای کلیدی کشور خواهد بود و کمک میکند صدها دانش جدید از متون وب ایجاد شود.
علیرضا نوروزی، دانشیار گروه علم اطلاعات و دانششناسی دانشگاه تهران نیز گفت: سازمان اسناد و کتابخانه ملی ایران میتواند در حوزه هوش مصنوعی پیشگام باشد، اقدام امروز سازمان اسناد و کتابخانه ملی ایران با رویکرد استخراج اطلاعات کتابشناسی با استفاده از سیستمهای هوش مصنوعی هدایتشده قابل تحسین است.
او ضمن اعلام خوشبینی به اجرا و تداوم این پروژه، ادامه داد: امید است در آینده نزدیک شاهد اجرای طرحها و پروژههای دیگر با بهرهمندی از گنجینه اسناد سازمان اسناد و کتابخانه ملی ایران باشیم. با توجه به حضور و فعالیت تیم جوان در سازمان اسناد و کتابخانه ملی ایران در حوزه هوش مصنوعی به آینده این سازمان امیدوار هستم.
دانشیار گروه علم اطلاعات و دانششناسی دانشگاه تهران خاطرنشان کرد: در حوزه دادههای پیوندی سازمان اسناد و کتابخانه ملی ایران میتواند همانند کتابخانه کنگره آمریکا و دیگر کشورها پیشگام باشد و از هوش مصنوعی و لینکدیتا بهرهمند شود.
انتهای پیام
نظرات