بی شک یکی از مهمترین تحولات عصر جدید انقلاب تکنولوژی است بویژه در شرایطی که از یکسو تولید داده و منابع دیجیتال بصورت نمایی و انفجاری در حال رشد است و از سوی دیگر دسترسی جامعه به سیستمهای هوشمند رایانهای نیاز مخاطبین را بسیار دیگرگون ساخته است. این نکات تهدیدهای آتی مراکز مدیریت دانش و اطلاعات هستند، یک رویکرد میتواند تلاش در راستای بی توجهی و یا حتی سرکوب این تهدید در کلام باشد و رویکرد دیگر میتواند این تهدید را با برنامهای مناسب به یک فرصت تبدیل کند.
حجم داده تولیدی بشر در دو سال گذشته برابر 90 درصد کل اطلاعاتی است که بشر در طول تاریخ ایجاد کرده است. این حجم از تولید و نشر اطلاعات بر ما روشن میسازد که گردآوری، سازماندهی و اطلاعرسانی این حجم از اطلاعات نیازمند تحولی جدی در فرایندها و رویکردها است.
از سوی دیگر بر کسی پوشیده نیست که اقتصاد دیجیتال، آیندهی اقتصاد دنیا است و پیشبینی میشود گردش مالی جهانی کسب و کارهای مبتنی بر فناوریهای حوزه محتوا بویژه هوش مصنوعی تا 3 سال آینده از مرز 100 میلیارد دلار عبور کند، که این مهم در صورت سیاستگذاری مناسب فرصتی مناسب برای حضور جوانان خلاق و هوشمند ایران زمین فراهم میکند.
از سوی دیگر نیاز جامعه پژوهشی نیز روز به روز توسعه یافته تر و متنوع تر میشود و کار به جایی میرسد که پژوهشگران، دستیاران پژوهش هوشمند را مطالبه میکنند. در این وادی اگر مراکز اطلاعات، کتابخانه ها و آرشیوها خدمات مناسب، هوشمند و به روز ارائه ندهند در این عرصه رقابت بدل به موزه خواهند شد.
نیاز سازمان اسناد و کتابخانه ملی
آینده کتابخانهها و مراکز آرشیوی با هجوم حجم گسترده منابع دیجیتال از یکسو و گسترش وسایل ارتباطی از سوی دیگر مجالی برای ارائه خدمات بر پایه رویکردهای سنتی کتابخانهای نگذاشته است و اگر تهدید تکنولوژی و عقبماندگی از آن را به فرصت بدل نکنیم دیگر بطور کلی جایگاه خویش را در ارائه خدمت به پژوهشگران از دست خواهیم داد. به بیان دیگر این نیاز امروز جامعه است و چنانچه سازمان اسناد و کتابخانه ملی همچون گذشته غافلانه با آن برخورد کند یا یک بخش دیگر دولت آنرا پاسخ میدهد و یا بخش خصوصی با توان و توشهای کم مقدار آنرا انجام خواهند داد که در هر دو صورت سازمان مرجعیت خود را بیش از پیش از دست خواهد داد و در نهایت خدمات مناسب به مخاطبین به سختی و تاخیر خواهد رسید.
از این روی سازمان نیاز دارد تا برخی از خدماتی را که تا به امروز با تکیه بر نیروی انسانی ارائه میداده است یا امکان ارائه آن میسر نبوده را به کمک فناوریهای هوش مصنوعی، تحلیل دادههای کلان، بلاکچین یا سایر فناوریها تهیه و با سرعت، دقت، کیفیت و تنوع مناسب تری در اختیار مخاطبین فرهیخته خویش قرار دهد.
نیاز گروه های استارتاپی حوزه محتوا
غالب استارتاپهای تا به امروز فعال و موفق کشورمان در وادی ارائه پلتفرمی خدمات کسب و کار خویش را استوار کرده بودند و تلاش داشتند تا اتصال پلتفرمی و شفاف ارائه دهنده و ارائه گیرنده کالا یا خدمت را میسر کنند و نسل بعدی استارتاپهای با فناوری پیشرفته هنوز بدرستی فعال نشدهاند. توسعه استارتاپهای حوزه محتوا با تکیه بر تکنولوژیهای پیشرفته هوش مصنوعی و تحلیل داده کلان نیازمند دادههای کلان دیجیتال و دستهبندیشده زبان فارسی است که پیشتر توسط انسانی پردازش شده باشند، این دادههای در کنار فرادادههای پردازش شده آنها، سامانههای هوش مصنوعی را آموزش میدهند و برای خدمات نوین آماده میکنند. این مهم در جهان اگرچه برای زبانهای دیگر رخ داده و توسعه یافته است، اما برای زبان فارسی که جز ایران، تاجیکستان و افغانستان حامی دولتی دیگری ندارد هنوز رخ نداده است. از سوی دیگر بازار بسیار بزرگی (از باب تعداد و توان مالی) هم نبوده و مشکلات این سه کشور از تحریم گرفته تا ضعف اقتصادی، بستر را برای سرمایه گذاری غولهای بینالمللی نیز چندان فراهم نکرده است.
این مساله زمانی رنگ مهمتری به خود میگیرد که بدانیم سازمان بزرگترین گنجینه منابع فارسی جهان را در اختیار دارد و با ورود خود میتواند کمک به رفع این مانع بزرگ توسعه فناوری های هوش مصنوعی در کشور باشد و بهترین حامی و پشتیبان توسعه این استارتاپهای باشد.
اقدامات سازمان در حوزه نوآوری
طرح نوآوري سازمان از سال 1397 بر پايه سه هدف زير آغاز شد:
- ايجاد بستر مناسب براي دريافت راهحلهاي نوآورانه به منظور حل چالشها و مشکلات سازمان از طريق کسب و کارهاي نوپا در حوزه محتوي؛
- ايجاد ارزش افزوده بر پايه دادهها و محتواهاي موجود؛
- ايجاد فضايي براي رشد ايدههاي نو در زمينه محتوا و تکنولوژيهاي کتابخانهاي و آرشيوي.
اين طرح براي نخستين بار با همکاري سازمان فناوري اطلاعات کشور و معاونت علمي و فناوري رياست جمهوري و با مشارکت شتابدهنده خصوصي نوينتک و مرکز نوآوري دانشکده برق و دانشکده کامپيوتر دانشگاه تهران و صندوق نوآوري و شکوفايي، اولين رويداد بر مبناي چالشها (برگزاري رويداد معرفي معکوس Reverse Pitch) در حوزه محتوا بر اساس بزرگترين گنجينه محتواي فارسي و در راستاي اهداف فوق برگزار شد.
نخستين اعلام حضور سازمان در اين عرصه و رونمايي از طرح اين برنامه نوآوري در رويداد ويتا در تيرماه 1398 برگزار شد که مورد استقبال متخصصين حوزه فناوريهاي هوش مصنوعي قرار گرفت. از جمله اقدامات اجرايي اين رويداد ميتوان موارد ذيل را برشمرد:
- تهيه دادههاي مورد نياز تيمهاي شرکت کننده در رويداد ويتا
- جلسات تخصصي با تيمهاي شرکت کننده در رويداد ويتا به منظور بررسي ابعاد اجرايي طرحها
- آماده سازي فرادادهها و OCR پايان نامه ها براي تيم creative minds
اين رويداد با مشارکت 352 نفر و ارائه 90 طرح آغاز شد. در حال حاضر 7 طرح از خروجي گروههاي استارتاپي در مرکز رشد سازمان فعال هستند.
از جمله دستاوردهاي برگزاري رويداد ويتا، شناسايي استعدادهاي موجود در سطح کشور براي اجراي طرحهايي است که پتانسيل موجود در سازمان را در جهت ارائه خدمات نوين اطلاعاتي شناسايي نمايد. در اين راستا انتشارات روزبهان که بزرگترين فروشنده آنلاين کتاب و محصولات فرهنگي است پيشنهاد همکاري در جهت ارائه دادههاي سازمان در قالبي نوين و با استفاده از فنآوريهاي هوش مصنوعي ارائه نمود. انجام مطالعات وسيع در خصوص جزئيات فني همکاري سازمان با انتشارات روزبهان و رسيدن به نقطه مشترک براي شروع فعاليتها بوده است.
در همين راستا، ساختمان 6 طبقه سازمان واقع در خيابان بهآفرين با زيربناي حدود 1250 متر مربع ، با حمايت معاونت علمي و فناوري رييس جمهور، بازسازي و تبديل به ساختمان نوآوري سازمان با هدف راه اندازي و توسعه فعاليتهاي نوآورانه گشت و محل استقرار، آموزش و فعاليت استارتاپهاي اين حوزه خواهد بود. طبقات اجرايي اين ساختمان عبارت است از:
- طبقه همکف لابي برج ليبتک و محل استقرار ميز خدمت؛
- طبقه اول: فضاي کار اشتراکي؛
- طبقه دوم: فضاي کار اشتراکي اقتصاد ديجيتال؛
- طبقه سوم: مرکز توسعه خدمات ليبتک؛
- طبقه چهارم: آکادمي ليبتک؛
- طبقه پنجم: کافه و مرکز سرگرمي ليبتک.
با تکیه بر ضرورتهای پیش گفته، از سال 1397 با همکاری معاونت علم و فناوری ریاست جمهوری، وزارت ارتباطات و فناوری اطلاعات و صندوق نوآوری و شکوفایی طرح نورآوری سازمان تنظیم شد، و سازمان به عنوان بخشی از دولت که دارنده منابع غنی فارسی است برای حمایت از استارتاپهای حوزه محتوا اعلام آمادگی کرد و برنامه ای با برند فناوریهای حوزه کتابخانه و آرشیو یا LibTech طراحی و پیاده سازی کرد.
مرکز نوآوری و توسعه کسب و کارهای داده محور
برای پیشبرد اهداف فوق و کمک به توسعه کسب و کارهای داده محور از یکسو و تزریق نوآوری در سازمان، مرکز نوآوری و توسعه کسب و کارهای داده محور در تیرماه سال 1399 با حضور دکتر سورنا ستاری در ساختمانی به مساحت 1500 متر مربع در 5 طبقه افتتاح شد. این مرکز پیشران برنامه نوآوری سازمان است و نقطه اتصال و تعامل سازمان با سایر گروههای استارتاپی، شرکتها و سیاستگذاران این اکوسیستم است.
این مرکز تلاش دارد در نقد سیاستهای بخشهای دولتی که بصورت فصلی به این وادی پا نهادهاند و نمایشهای خوبی برپا ساختهاند، در هرجا که بخش خصوصی توانسته موثر ایفای نقش کند و نیاز جامعه را مرتفع سازد ورود رقابتی با آنها نداشته و توان بخش خصوصی را به مشارکت دعوت کند. از این دسته میتوان به شتابدهندهها اشاره داشت، که با توجه به توان امروز شتابدهنده های خصوصی کشور دیگر نیازی برای راهاندازی یک شتابدهنده جدید برای سازمان احساس نمی شود و در رویدادها و فرایندهای بعدی توسعه استارتاپها از ظرفیت شتابدهندههای کشور استفاده مینماید. سایر حلقههای بلوغ و توسعه کسب و کارها نیز با همکاری بخش خصوصی در ساختمان نوآوری سازمان راه اندازی شده است که از آن جمله میتوان به موارد ذیل اشاره داشت:
1-1 فضای کار اشتراکی
فضایی برای استقرار گروههای استارتاپی برای کاهش هزینههای شرکتداری و هزینههای تهیه و نگهداری دفتر و فضای کار با همکاری بخش خصوصی انجام یافته است.
1-2 فضای کار اختصاصی
فضایی اختصاصی (اتاق مستقل) با امکانات به اشتراک گذاشته اداری برای استقرار آن دسته از گروههای استارتاپی که گامهای اولیه مستقل شدن را طی میکنند.
1-3 مرکز رویداد
بخشی از این مرکز باید متمرکز بر روی شناخت چالشهای سازمان استخراج آنها و طراحی رویدادهایی برای به همکاری و مشارکت طلبیدن گروههای استارتاپی برای حل آنها باشد و از سوی دیگر فضایی برای آشنایی سایر ارکان اکوسیستم با این مرکز هم طراحی نماید. این مهم نیز با همکاری بخش خصوصی در مرکز راه اندازی شده است و تا پیش از کرونا رویداد لیبتک 1 را با عنوان ویتا بخوبی برگزار نموده است.
1-4 لیبتک استودیو
از مهمترین مراکز مستقر در ساختمان نوآوری که برای هدایت و حمایت استارتاپها در این عرصه جدید نوآوری ایجاد میشود کارگاه فناوریهای کتابخانه ای و آرشیوی است که با پردازش اولیه دادههای سازمان به عنوان یک پیش شتابدهنده عرصه را برای فعالیت سایر استارتاپها تسهیل مینماید. در حال حاضر یکی از مهمترین پروژههای این بخش راه اندازی پایگاه دادگان کلان فارسی است که در بخش خود بدان پرداخته میشود.
1-5 لیبتک آکادمی
حلقه آخر این اکوسیستم شاید آموزشهای تخصصی باشد. مرکزی که آموزشهای تخصصی این حوزه را به شیوههای نوین و مطلوب مخاطب ویژه این حوزه بتواند ارائه دهد گام دیگر حمایتی این برنامه نوآوری سازمان خواهد بود که به کمک بخش خصوصی راهاندازی و هدایت میشود. این مهم با همکاری ستاد اقتصاد دیجیتال معاونت علم و فناوری ریاست جمهوری در حال راه اندازی است.
1-6 تجهیزات زیرساختی
یکی از مهمترین نیازمندیهای گروههای استارتاپی فناوریهای کتابخانهای و آرشیوی تجهیز لازم برای پردازشهای تصویری گسترده و پرحجم است. تجهیز مرکز داده حمدایران متعلق با سازمان در راستای حمایت از این نهالهای عرصه جدید نوآوری با حمایت معاونت علمی و فناوری انجام یافته است، از سوی دیگر اخذ این خدمات از بخش خصوصی نیز فرصت دیگری برای حمایت از گروههای استارتاپی مورد حمایت خواهد بود.
2- ساختمان نوآوری سازمان
یکی از مهمترین نیازهای این مرکز فضای کالبدی استقرار ارکان این برنامه توسعه است. از همین روی ساختمان 5 طبقه سازمان واقع در خیابان بهآفرین، با کمک معاونت علم و فناوری بصورت اساسی بازسازی و بهسازی شده است و بدل به ساختمان نوآوری سازمان یا ساختمان LibTech و محل استقرار، مرکز نوآوری و توسعه کسب و کارهای داده محور و گروههای استارتاپی شده است.
ساختمان پیشین آرشیو ملی ایران که پیش از این به مدت 15 سال بدون استفاده بوده است با این نوسازی به سومین ساختمان فعال سازمان در شهر تهران بدل شد، با کارویژه ای نوین و معطوف به آینده.
3-صندوق پژوهش و فناوری
آخرین گام مسیر توسعه کسب و کارهای نوپا سرمایه گذاری روی آنهاست و از آنجا که موفقیت آنها دارای ریسک بالایی است در اصطلاح سرایه گذاری خطرپذیر میگویند. به منظور حمایت و سرمایه گذاری در استارتاپهای مستعد این حوزه بصورت تخصصی صندوق پژوهش و فناوری سازمان با حمایت معاونت علم و فناوری و صندوق نوآوری و شکوفایی در حال تاسیس است. این صندوق سرمایهگذاری خطرپذیر به عنوان بازوی حمایتی سازمان برای پشتیبانی از استارتاپهای موفق این عرصه ایفای نقش میکند. شایان ذکر است این صندوق طبق مصوبه صندوق نوآوری و شکوفایی با مشارکت 60 درصدی بخش خصوصی در حال راه اندازی است.
4-رویداد ویتا
نخستین اعلام حضور سازمان در این وادی و رونمایی از طرح این برنامه نوآوری در یک رویداد معرفی معکوس(Reverse Pitch) با نام ویتا در تیرماه 1398 با همکاری دانشگاه تهران، و شتابدهنده خصوصی نوین تک، معاونت علم و فناوری و سازمان فناوری با معرفی چالشهای سازمان برگزار شد که مورد استقبال بی سابقه متخصصین حوزه فناوریهای هوش مصنوع قرار گرفت، بطوری که از 350 نفر شرکت کننده در این رویداد حاضر شدند.
3 گروه استارتاپی نخستین خروجی رویداد ویتا است که هم اکنون در مرکز رشد سازمان فعال هستند که محصولات ذیل را ارائه خواهند نمود
- 4-1 سندجو: این گروه تلاش دارد تا با کمک هوش مصنوعی متن نسخ خطی و اسناد تاریخی را قابل جستجو کند.
- 4-2 چت بات: این گروه تلاش دارد مرجع مجازی سازمان که در این بخش چند نفر از متخصصین کتابداری وظیفه پاسخگویی به پرسشهای مراجعین در حوزه منبع شناسی و جستجوی کتاب را عهده دار است با کمک هوش مصنوعی توسط یک ربات انجام دهد.
- 4-3 ریکپچا: تلاش دارد در جایگزین کپچای رایگان گوگل با سامانه ای تصویر نسخ خطی و اسناد تاریخی را با کمک جمعسپاری و هوش مصنوعی به متن تبدیل کند. لازم به ذکر است که کپچای گوگل سرویس شناسایی انسان بودن مخاطب یک سامانه است که با درخواست به تایپ کردن تصویر عددی ارائه شده این مهم را تایید میکند.
- 4-4 راهنما: رویکردی جدید برای جستجوی بهتر در کتابفروشی ها، با استفاده از فراداده استاندارد و امکان دسته بندی موضوعی در کتابفروشی به مانند کتابخانه ها و در نهایت تسهیل جستجوی کتاب برای خرید آن.
5- پردازش خودکار- فاز نخست: فهرست توصیفی
حجم گسترده منابع دیجیتال دیگر مجالی برای مدیران مراکز دانش و اطلاعاتی برای استفاده از شیوههای سنتی و قدیمی را در زمینه پردازش و اطلاع رسانی منابع نمیدهد. به عنوان مثال مجموعه نزدیک به 500 هزار مقاله که در سال 1398 به گنجینه سازمان افزوده شده اگر میخواست به شیوه سنتی و توسط انسان پردازش شود با اتکا به نیروهای فعلی سازمان و به فرض متوقف شدن ورودی جاری سازمان نزدیک به 8 سال زمان نیاز داشت.
در همین راستا برای استفاده بیشتر از ظرفیت تکنولوژی در امر پردازش منابع، سازمان اقدام به راه اندازی سامانه ای کرد که بتواند بصورت خودکار و ماشینی فهرست نویسی را انجام دهد. فاز نخست این سامانه که در دیماه 1398 به بهره برداری رسید در ابتدا فایل تصویر را تبدیل به متن میکند و از دل متن تبدیل یافته فراداده را استخراج میکند. این سامانه پروژه 8 ساله را یعنی پردازش 500 هزار مقاله را در مدت دو ماه (البته با امکانات سخت افزاری محدود فعلی) انجام میدهد. این سامانه که اکنون برای استخراج فراداده مقاله تنظیم شده است.
در تکمیل فاز نخست جهت خودکارسازی استخراج اطلاعات مندرج در منبع اطلاعات سازمان امروز مجهز به سامانه ای است که به کمک هوش مصنوعی با روش یادگیری عمیق با دقت مناسب اطلاعات مندرج در انواع منابع مکتوب را از نسخه دیجیتال منبع استخراج و در چارچوب استاندارد مارک ایران ارائه مینماید. این سامانه تاکنون بر روی سه منبع پایان نامه، کتاب و مقاله تمرکز نموده است و در بهمن ماه 1399 رونمایی شده است.
با این سامانه کلیه اطلاعات فهرست نویسی (توصیفی و تحلیلی) مقاله و پایان نامه تکمیل میشود، چرا که کلید واژه در مقاله و چکیده در پایان نامه مستقر است و با اتمام این فرایند اطلاعات مورد نیاز این دو نوع منبع با حداقل نظارت انسانی تکمیل میشود.
اما در باب کتاب مساله متفاوت است، اطلاعات توصیفی موجود در کتاب نیمی از اطلاعات مهم مورد نیاز برای سامانه جستجو برای کمک به بازیابی اطلاعات برای مخاطبین است و دادن موضوع، و رده به کتاب نیازمند انسان است و این سامانه کمکی نمی تواند بکند.
6- پردازش خودکار- فاز دو: فهرست تحلیلی
فاز دوم این پروژه تلاش دارد تا به کمک هوش مصنوعی بر اساس محتوای تبدیل به متن شده منبع، فهرست تحلیلی متن را تعیین کند. به بیان دیگر هوش مصنوعی برای تعیین موضوع و رده کتاب یا هر منبع دیگری به کمک آمده و بر اساس الگوهای از پیش آموزش یافته خود به مرور با دقت و سرعتی بالا به عنوان دستیار توانمند فهرست نویس این مهم را محقق سازد که این مهم در رویدد لیبتک 2 در زمستان سال 1399 از 20 دی تا 20 اسفند) در حال عملیاتی شدن است.
بخش دیگری که سازمان قصد دارد آنرا عملیاتی سازد استخراج فهرست نشریات ایران است. تاکنون رویکرد پردازش نشریات در ایران و جهان متکی به شیوه کاردکس بوده است و تنها اطلاعات بسیار مختصری از نشریه مربوطه ارائه میشده است و پژوهشگر برای جستجو در آنها یا باید به اطلاعات پیشینی خویش اتکا کند و یا به تورق در لابلای نشریات به شیوه سنتی میتوانند از اطلاعات مندرج در آن استفاده کنند. این مهم در قالب یک رویداد توسط سازمان برای نخستین بار در حال طراحی و برگزاری است.
7- رویداد لیبتک2
برای کمک به دستیابی
چالش تشخیص موضوع منبع مکتوب محور اصلی رویداد استارتاپی سازمان شد. در این رویداد تلاش است با تمرکز بر تشخیص موضوع Topic Detection در گام نخست داده رده کنگره به کتاب را به کمک هوش مصنوعی خودکار سازد.
برای این مهم برای نخستین بار یک نمونه داده ای با بیش از 200 هزار عنوان کتاب با ردههای تعیین شده توسط فهرست نویسان کتابخانه ملی تهیه تا در فرصت دو ماهه به شرکت کنندگان این رویداد ارائه تا بالاترین دقت سامانههای درون رقابت انتخاب شود. تیم برنده علاوه بر دریافت جایزه، موظف به عقد قرارداد و ادامه آموزش سامانه برای افزایش دقت این تشخیص است.
این رویداد آغازگر فاز 2 پردازش خودکار: فهرست نویسی تحلیلی است و که در این مرحله دادن رده کنگره به کتب ارائه شده بصورت خودکار انجام میشود. در ادامه و به مرور با تکمیل دادههای نمونه بر اساس کتب و موضوعات داده شده به آنها، سامانه برای تشخیص موضوع و دادن موضوعها به کتاب به عنوان دستیار فهرست نویس مهیا میشود.