Приклад латинського письма. Через дефіцит площі, між словами часто не робили проміжків. Джерело: Getty Images
Google DeepMind розробила відкриту нейромережу Еней (Aeneas), яка допомагає відновлювати й давні пошкоджені латинські написи. Стародавні римляни залишили багато писемних пам'яток, однак не усі вони збереглися в ідеальному стані. Багато з них пошкоджені, велика частина дійшла до нас лише у вигляді фрагментів. Aeneas допомагає відновити втрачені частини тексту.
Відновлений бронзовий військовий диплом з Сардинії, виданий імператором Траяном матросу на військовому кораблі. Ілюстрація: predictingthepast.com/aeneas
Залиште свій скептицизм
Так, нейромережі можуть помилятися і вигадувати те, чого немає. Але Google підійшла до завдання з науковим підходом – для відновлення тексту нейромережі потрібен контекст. Знаючи період, до якого відноситься знахідка, і місце її виявлення, нейромережа аналізує словниковий запас, який зустрічається на знайдених пам'ятках тієї доби, а також події, актуальні для того часу, щоб вгадати втрачені слова максимально точно. Чи це дає гарантію, що Aeneas відтворить оригінальний напис безпомилково? Звісно ні, це неможливо. Але він зробить дійсно непогану роботу, засновану на науковому підході і потужних можливостях сучасних технологій. Особливо складне це завдання для пам'яток, де невідома навіть довжина втраченого фрагменту. Тож так, це не дає 100% гарантії в правдивості. Але для пам'яток, які пошкоджені безповоротно, кращого результату ми досягти вже не зможемо. Принаймні, до винайдення машини часу.
Технічні деталі Aeneas
- Модель сприймає як текст, так і зображення
- Навчена на ~176 000 латинських написах загалом 16 млн символів
- Названа на честь міфічного героя з Троянського епосу
- Створена спільно DeepMind із дослідниками з університетів Ноттінґем, Ворвік, Оксфорд та Афін
- Атрибуція: визначає, де (залежить від одної з 62 провінцій) і коли (точність до ~13 років) був створений напис
- Ефективність: при пошкодженнях до 10% символів правильний варіант у 73 % випадків; навіть без знання довжини — у 58 %
- Пошук аналогів: знаходить паралелі по стилі, формі, контексту
Інтерактивна версія Aeneas доступна на predictingthepast.com, а код і база даних — відкриті для дослідників.
Чому це важливо
Нейромережі дуже добре знаходять закономірності у великих масивах інформації, в яких людині дуже важко визначити взаємозв'язки. Тому такий підхід допоможе відновити трохи більше історичної інформації. Навіть помилившись в конкретних словах, Aeneas може підказати основний посил тексту.
Джерело: www.engadget.com