Ученые НГУ и ИЦИГ СО РАН разработали новый подход для сбора, хранения и анализа информации о колосьях пшеницы
Ученые НГУ и ИЦИГ СО РАН представили новый подход для сбора, хранения и анализа информации о морфометрических характеристиках колоса пшеницы. Активное участие в работе по созданию системы SpikeDroidDB приняли студенты Механико-математического факультета НГУ, Факультета информационных технологий НГУ, а также Математического центра в Академгородке. Работа над данным проектом выполнена при поддержке Российского научного фонда, проект № 23-14-00150.
Информационная система SpikeDroidDB позволяет хранить цифровые изображения колоса, аннотировать их фенотипические характеристики по 14 важным признакам и предоставляет гибкую систему запросов для доступа к данным.
С использованием SpikeDroidDB произведена оцифровка и аннотация коллекции колосьев гибридов F2 от скрещивания австралийского сорта мягкой пшеницы Triple Dirk с образцом KU506 китайской пшеницы Triticum yunnanense. Проведен анализ изменчивости колосьев по форме, длине и ширине.
Структура колоса — один из важнейших признаков злаков, связанный с такими их хозяйственно ценными качествами, как продуктивность, устойчивость к факторам внешней среды и вредителям, легкость обмолота. Колосья различаются по форме, размерам, плотности, остистости, цвету и т.д.
Для селекционеров и генетиков большое значение имеют такие параметры, как число зерен в колосе, масса тысячи зерен и другие. Эти характеристики тесно связаны с продуктивностью растений. Полезным селекционным признаком является форма зерновки и такие характеристики колоса, как его тип, длина, профиль, наличие или отсутствие остей, число плодоносных и стерильных колосков (то есть озерненность), ломкость колоса, свойства колосковой чешуи. Собирать и описывать эти признаки вручную — процесс трудоемкий и длительный.
«Научные сотрудники нашей лаборатории давно занимаются решением важной задачи, направленной на то, чтобы заменить измерительные способы генетиков и селекционеров с линейки на компьютер или мобильный телефон. Мы хотели бы сделать так, чтобы ученым больше не надо было бы вручную измерять параметры растений, а просто сделать фотоснимок колоса пшеницы, соблюдая при этом ряд технических условий, и затем получить интересующую их информацию, загрузив это фото в нашу базу данных. Создавая ее, мы работали с обычным анализом изображений, то есть с цифровым зрением, и применили глубокое машинное обучение в части распознавания изображений с помощью нейросетей, выделения отдельных признаков и классификации», — рассказал ведущий научный сотрудник Лаборатории эволюционной информатики и теоретической генетики Института цитологии и генетики СО РАН, сотрудник кафедры информационной биологии Факультета естественных наук Новосибирского государственного университета Дмитрий Афонников.
Сложность работы исследователей состояла в том, что в ее основу были заложены цифровые изображения колосьев. Именно они служат исходными данными при применении методов автоматического фенотипирования. При их разработке важной задачей является экспертная оценка многих характеристик растений для их дальнейшего использования в обучении и верификации компьютерных алгоритмов. Однако множество морфологических признаков колоса принято оценивать качественно, а не количественно. Очень часто они не имеют количественной оценки. К таким признакам относятся форма колоса, его плотность, цвет колоса, опушение колосковых чешуй, тип остистости, цвет остей, форма колоса, ломкоколосость и множество других. Поэтому применение подходов цифрового анализа изображений для описания формы зерна и колоса, а также их сопоставление с оценками признаков колоса, выполненных экспертами-селекционерами, стала для разработчиков важной задачей.
«В своей базе данных мы собрали более 10 тысяч цифровых изображений колосьев и описали их структуру и свойства, чтобы ученые-генетики могли по фотографии получить все необходимые им данные — размеры колоса, его толщину, ширину, наличие остей, цвет колосьев и прочее, фактически заменив привычные измерения на анализ изображений. И мы получаем в итоге больше характеристик, к тому же они отличаются большей точностью. В данном случае у автоматизированной системы возможностей больше, чем у человека. Если некоторые параметры человек определяет «на глаз», то компьютерное зрение фиксирует их более точно и продуктивно. С помощью компьютерного анализа цифровых изображений мы можем определять сотни параметров колосьев — как основных, так и их производных, и далее использовать их для разработки методов и классификаций, а также оценки продуктивности. Такие технологии обеспечивают высокую степень автоматизации сбора информации, ее хранение в базах данных, интеграцию с данными о генотипе и параметрах окружающей среды, создают основу для интеллектуального анализа полученной информации. Имеется и еще одно важное преимущество: цифровое описание колоса и его изображение будут храниться в базе данных сколь угодно долго, тогда как высушенный колос, помещенный в бумажный конверт, может рассыпаться, сменить цвет или испортиться, и образец будет утрачен», — пояснил Дмитрий Афонников.
В системе SpikeDroidDB с каждым колосом можно соотнести несколько изображений. Для каждого из них указывается протокол, с помощью которого оно было получено. Для съемки разработчики использовали два протокола получения цифровых изображений зрелых колосьев. Они выбрали синий фон, как наиболее контрастный к цвету колосьев и позволяющий легко отделить объект от фона. Съемка колосьев проводилась в двух вариантах: в первом колос располагается вертикально перед синим фоном, второй вариант съемки предусматривает горизонтальное положение колосьев на стекле над синим фоном.
Прототип системы SpikeDroidDB доступен по ссылке http://spikedroid.biores.cytogen.ru/. Главная страница содержит краткую информацию о базе данных, ссылки для входа в систему или регистрации и ссылки на основные блоки информации в базе данных.
Дмитрий Афонников рассказывает, что селекционеры и генетики, занимающиеся выведением новых сортов пшеницы, проявляют большой интерес к данной разработке и высказывают заинтересованность в работе с ней, чтобы автоматизировать кропотливые и длительные рутинные процессы, требующие точности и концентрации внимания. Кроме того, система SpikeDroidDB позволит избежать субъективных оценок, ошибок и неточностей при фенотипировании образцов колосьев.