Авторы исследования сделали подборку из нескольких сотен клипарт-картинок людей, животных и бытовых предметов, а затем предложили добровольцам составить из этого набора простые коллажи. При этом в половине случаев участников просили, чтобы коллаж был смешным. Другим добровольцам после этого предлагали оценить все получившиеся коллажи от одного (картинка совсем не смешная) до пяти (картинка очень смешная).
Поскольку коллажи состояли из одного и того же набора элементов, для них легко было составлять текстовое описание. Его использовали для обучения простой нейронной сети, чтобы классифицировать картинки на смешные и несмешные. Оказалось, что в группу смешных картинок чаще всего попадали изображения, на которых один или несколько объектов были в необычном для них контексте. Например, на одном из коллажей животные обедали, сидя за столом, а человек сидел в собачьей корзинке.
Чтобы удостовериться, что именно контекст чаще всего отвечает за юмор, программу также обучали, как из смешной картинки сделать несмешную или наоборот. Для этого алгоритм выбирал несколько фрагментов коллажа, больше всего выбивавшихся из общей сцены, и менял их на более подходящие элементы.
Получившиеся после замены коллажи показывали добровольцам и просили определить, кто составлял этот коллаж: человек или компьютер. В 28% случаев участники считали, что автором был человек, хотя на самом деле коллаж составляла программа. Авторы отмечают, что наилучшим результатом в данном случае считалось бы 50%: это означало бы, что коллажи неразличимы.
По мнению ученых, в их работе впервые делается попытка автоматического анализа смешных изображений. В будущем подобные исследования могут найти применение, например, для контекстной рекламы или для программирования автоматических камер, делающих снимок, только когда в кадре происходит что-то смешное.