Научное сообщество борется с проблемой воспроизводимости данных — ключевого шага в процессе, который определяет, как большинство ученых создают знания в своей области.

Исследователи из Института молекулярной инженерии и Аргоннской национальной лаборатории разработали платформу для предоставления доступных для поиска данных публикаций ученых для решения проблемы воспроизводимости. Фото: shutterstock.com

Согласно недавнему опросу, более 70 процентов исследователей пытались воспроизвести опубликованные эксперименты другого ученого и не смогли воспроизвести их. Более половины даже не смогли успешно воспроизвести свои собственные расследования. Возникает вопрос: если эксперимент или симуляция не могут быть воспроизведены, был ли он успешным в первую очередь?

Исследователи из Института молекулярной инженерии Чикагского университета и Аргоннской национальной лаборатории стремятся помочь решить эту проблему с помощью новой программной платформы, которая позволяет ученым обмениваться данными каждой из своих публикаций с возможностью поиска. За последние два года они разработали инструмент для курации, поиска и исследования воспроизводимых научных работ под названием Qresp, который теперь доступен для публичного использования.

«Наша цель — ускорить научный процесс и сократить время, необходимое для обмена знаниями между исследователями», — сказала Джулия Галли, профессор молекулярной инженерии семьи Лью. «Делая данные доступными и доступными для поиска, мы надеемся облегчить для исследователей воспроизведение результатов».

Процесс воспроизведения научных результатов остается сложной проблемой. Опубликованные документы, которые доступны в Интернете в формате PDF, часто не содержат достаточной информации о полученных данных и процессах, чтобы другие могли воспроизвести результаты, а данные часто не предоставляются научному сообществу.

«Многие документы не содержат достаточных подробностей, чтобы можно было воспроизвести данные», — сказал Марко Говони, ассистент в Аргонне и приглашенный ученый в Чикагском университете. «И часто большинство данных, полученных и используемых в статье, вообще недоступны. Чтобы получить эти данные, иногда нужно написать авторам статьи. Это не должно быть так сложно, и это не должно быть специальным процессом».

С помощью Qresp исследователи надеются помочь облегчить некоторые из нынешних трудностей в обеспечении открытости и воспроизводимости данных. Программное обеспечение помогает пользователям в процессе организации и обмена их данными, включая наборы данных и диаграммы. Все поля настраиваются, что позволяет исследователям наилучшим образом составлять свои данные в соответствии с написанной ими статьей. Платформа также доступна для всех, кто хочет исследовать данные, которыми обмениваются другие исследователи.

Несмотря на то, что было предпринято несколько попыток управления большими наборами данных, большая часть этих усилий основана на центральном хранилище, а Qresp — на распределенной модели. В рамках платформы исследователи не загружают данные, а размещают свои собственные кураторские данные и решают, чем они хотят поделиться. Таким образом, по словам Говони, Qresp предоставляет масштабируемое решение для обмена данными.

Исследователи, которые, возможно, не захотят сделать этот дополнительный шаг, чтобы поделиться своими данными сразу после публикации, должны рассмотреть преимущества организации и обмена данными для своей собственной группы, сказал Галли. Студенты в ее группе теперь автоматически курируют свои данные в Qresp как еще один шаг в их научных исследованиях. Qresp облегчает передачу информации и знаний между проектами, выполняемыми разными студентами, и между оставшимися исследователями и теми, кто покидает группу.

«Весь процесс обмена данными в группе стал намного более эффективным», — сказал Галли, который также является профессором химии и старшим научным сотрудником в Аргонне.

С использованием и внедрением Qresp широким сообществом исследователей опубликованные документы могут стать гораздо более интерактивными — живым интерфейсом, где, нажав на изображение, исследователь может увидеть набор данных за результатами.

«Мы хотим поднять планку воспроизведения научных результатов, и мы хотим выйти за рамки публикации PDF-файлов и делиться результатами исследований, которые намного более интерактивны и полезны», — сказал Говони.

По материалам phys.org