Подобно переходу от камеры-обскуры к поляроиду, значительное математическое обновление формулы для популярного метода визуализации биоинформатических данных позволит исследователям создавать моментальные снимки экспрессии гена в одной клетке не только в несколько раз быстрее, но и с гораздо более высоким разрешением. Опубликованное в журнале Nature Methods , это новшество Йельских математиков сократит время рендеринга набора данных РНК-секвенирования (scRNA-seq) из одной ячейки в миллион пунктов с трех часов до всего лишь пятнадцати минут.

Полный набор данных о клетках головного мозга 1,3 миллиона мышей с использованием нового метода визуализации FIt-SNE (слева) по сравнению с понижением выборки до случайных 50000 клеток со старой техникой t-SNE (справа). Фото: Йельский университет

Ученые говорят, что существующий десятилетний метод t-распределенного Stochastic Neighborhood Embedding (t-SNE) отлично подходит для представления паттернов в данных секвенирования РНК, собранных на уровне одной клетки, данных scRNA-seq, в двух измерениях. «В этой ситуации t-SNE« организует »клетки по генам, которые они экспрессируют, и используется для обнаружения новых типов клеток и состояний клеток», – сказал Джордж Линдерман, ведущий автор и доктор философии Йельского университета. студент, специализирующийся на прикладной математике.

По вычислительным стандартам t-SNE довольно медленный. Таким образом, исследователи часто «сокращают» свой набор данных scRNA-seq – берут меньший образец из исходного образца – перед применением t-SNE. Тем не менее, пониженная выборка является плохим компромиссом, так как маловероятно, что t-SNE сможет охватить редкие клеточные популяции, которые часто являются тем, что исследователи чаще всего хотят идентифицировать.

Более 30 лет назад другая группа математиков Йельского университета разработала метод быстрой многополюсности (FMM), революционную численную технику, которая ускорила вычисление дальнодействующих сил в проблеме n-тела. Исследователи в этом исследовании признали, что принципы, лежащие в основе FMM, могут также применяться к задачам нелинейного уменьшения размеров, таким как t-SNE, и ускоренному t-SNE, пока оно не получит свое новое имя: FIt-SNE, или t на основе быстрой интерполяции. -SNE.

«Используя наш подход, исследователи могут не только быстрее анализировать данные РНК-секвенирования отдельных клеток, но и использовать их для характеристики субпопуляций редких клеток, которые не могут быть обнаружены, если данные субдискретизированы до t-SNE», – сказал Юваль Клюгер, старший Автор и Йельский профессор патологии. Кроме того, команда использовала визуализацию в стиле тепловых карт для своих результатов FIt-SNE, что позволяет исследователям легко видеть паттерны экспрессии тысяч генов на уровне отдельных клеток одновременно.

Исследователи сказали, что 2019 год не может быть лучшим новым годом для t-SNE, чтобы получить «FIt». В декабре 2018 года журнал Science назвал отслеживание развития эмбрионов клетка за клеткой – это невозможно сделать без визуализаций, основанных на данных scRNA-seq, – Прорыв Года. По словам исследователей, FIt-SNE ускорит дальнейшую работу в этой области биологии развития, а также в таких областях, как нейробиология и исследования рака, где секвенирование отдельных клеток стало неоценимым инструментом для картирования мозга и понимания опухолей.

По материалам phys.org