Posted 8 июля 2019, 03:30
Published 8 июля 2019, 03:30
Modified 7 марта, 15:45
Updated 7 марта, 15:45
Команда американских ученых создала систему искусственного интеллекта, основанную на технологии Word2vec. Этот метод по своей сути чисто лингвистический. Каждое слово представляется в виде набора n чисел (координат). Другими словами, оно становится точкой в n-мерном пространстве, сообщают "Вести.Наука".
Компьютер вычисляет, как часто те или иные слова встречаются поблизости друг от друга. На этом основании он присваивает им значения координат. Предполагается, что слова с близкими координатами имеют похожий смысл.
Исследователи "скормили" системе 3,3 миллиона аннотаций научных статей, опубликованных более чем в тысяче журналов в период между 1922 и 2018 годами. Искусственный интеллект выделил в них примерно полмиллиона различных слов. Каждое слово он представил в виде набора из двухсот координат.
При этом в программу не было заложено никаких сведений по химии или физике. Все свои "познания" система почерпнула из аннотаций научных статей. Тем более удивительными получились результаты.
Например, исследователи выяснили, какие координаты в 200-мерном пространстве получило название каждого химического элемента. Спроецировав эту картину на плоскость, они получили некое подобие таблицы Менделеева. Элементы оказались сгруппированы по своей природе: отдельно инертные газы, отдельно щелочные металлы, отдельно двухатомные неметаллы и так далее.