Подход детального анализа и просмотра фильма ради сбора материала для исследования категорически нам не подходит, поскольку требует огромных ресурсов. Реккья в своем исследовании предлагает иной способ оценки наших представлений: при помощи математических и лингвистических моделей, анализа ключевых слов, реплик и в меньшей степени анализа событий, ассоциирующихся с интеллектуальной машиной.
Конечно, нет ничего проще, чем, используя алгоритмы больших языковых моделей (Large language model, LLM), нейронных сетей, натренированных на тексте и применяющих в анализе миллиарды параметров систематизирования текстовой информации, разобрать связь между словами, фразами в больших массивах текста, таких как сценарий фильма, текст книги, комментарии в интернете. Несложно развернуть на домашнем компьютере LLM, натренировать ее преимущественно на текстовом материале, который необходимо разобрать, попросить провести анализ через серию запросов. Получится даже немного романтично: искусственный интеллект изучает человеческие представления о себе. Но не стоит слишком усложнять простую задачу. Грубый пересчет, как у Реккья, вполне нам подойдет, чтобы произвести первичную оценку и наметить дальнейшее направление исследования.
Считаем слова
Ключевое слово
Любой фильм, сериал или шоу на специализированных сайтах, таких как «Кинопоиск» и IMDb, могут быть отсортированы и найдены по названию, дате выхода, жанру и ключевым словам. Ключевые слова в анализе играют важнейшую роль, поскольку именно они сортируют и организуют фильмы по тем качествам, которые им присущи. К сожалению, на страницах отечественного «Кинопоиска» найти удобный функционал работы с ключевыми словами не удалось, поэтому использовался IMDb, который на момент написания этой книги имеет базу в более чем 14 млн фильмов, шоу и сериалов и более дружественный интерфейс для чтения ключевых слов.
Мы повторяли некоторые шаги, описанные в оригинальном исследовании Реккья. Это означает почти полную воспроизводимость результатов исследования.
В IMDb ключевое слово это слово или группа слов, с которыми ассоциируется фильм, шоу, сериал или даже эпизод многосерийного произведения. Они используются для описания значимых объектов, событий и идей, которые показаны в кинокартине. Ключевые слова назначаются в ряде случаев автоматически, но часто их вводят и уточняют пользователи ресурса для большей детализации. В нашем случае вышеназванные кинокартины имеют следующее количество ключевых слов.
Сноски
1
Идея серебряных или бронзовых челюстей пришла еще из каменного века. В эпоху Киевской Руси им придавалось охранительное значение. Считалось, помимо прочего, что зубы зверя отпугивают врагов, как видимых, так и невидимых. Прим. авт.