Ученые факультета информатики и вычислительной техники ЯрГУ им. П. Г. Демидова создали уникальную программу, способную находить требуемые по запросу слова и словосочетания из документации на русском языке. Разработка получила государственную регистрацию в Федеральной службе по интеллектуальной собственности. Авторы проекта, доцент кафедры вычислительных и программных систем Ольга Леванова и ассистент Мария Аверина, сообщили, что программа может облегчить электронный документооборот, значительно ускорив рабочий процесс. Сфера ее применения обширна — отчетная документация, работа с судебными решениями, сбор статистических данных и многое другое.— Сотрудник банка может отсканировать кредитный договор, а программа автоматически распознает фамилию и имя клиента, его паспортные данные, сумму и дату выдачи кредита. В дальнейшем эта информация может быть использована для автоматизации бизнес-процессов, например, при добавлении нового клиента в базу данных, — пояснила Ольга Леванова. Алгоритм извлекает из документов так называемые в компьютерной лингвистике «именованные сущности». Это определенные смысловые фрагменты из текста, то есть информация, которую можно именовать конкретной категорией — фамилии, адреса, даты, валюты, города и улицы и многое другое. — Для обучения программе необходимо получить набор размеченных текстов, где выделены интересующие пользователя сущности. После этого модель способна выделять те же сущности, для новых, неразмеченных документов, — отметила доцент Демидовского университета. Действие программы уже успешно апробировали на массиве открытых данных судебных решений, а также текстовых документах университета. Сейчас команда разработчиков изучает алгоритмы и решения других нейросетей, созданных за последние полтора года, чтобы улучшить собственную модель. - Россия
- Северо-Западный
-
Центральный
- Белгородская область
- Брянская область
- Владимирская область
- Воронежская область
- Ивановская область
- Калужская область
- Костромская область
- Курская область
- Липецкая область
- Москва
- Московская область
- Орловская область
- Рязанская область
- Смоленская область
- Тамбовская область
- Тверская область
- Тульская область
- Ярославская область
- Южный
- Северо-Кавказский
- Приволжский
- Уральский
- Сибирский
- Дальневосточный
Выбрать субъект
Ярославская область
- Все субъекты
- Белгородская область
- Брянская область
- Владимирская область
- Воронежская область
- Ивановская область
- Калужская область
- Костромская область
- Курская область
- Липецкая область
- Москва
- Московская область
- Орловская область
- Рязанская область
- Смоленская область
- Тамбовская область
- Тверская область
- Тульская область
- Ярославская область
В ЯрГУ имени Демидова обучили нейросети извлекать «именованные сущности»
Ученые факультета информатики и вычислительной техники ЯрГУ им. П. Г. Демидова создали уникальную программу, способную находить требуемые по запросу слова и словосочетания из документации на русском языке. Разработка получила государственную регистрацию в Федеральной службе по интеллектуальной собственности. Авторы проекта, доцент кафедры вычислительных и программных систем Ольга Леванова и ассистент Мария Аверина, сообщили, что программа может облегчить электронный документооборот, значительно ускорив рабочий процесс. Сфера ее применения обширна — отчетная документация, работа с судебными решениями, сбор статистических данных и многое другое.— Сотрудник банка может отсканировать кредитный договор, а программа автоматически распознает фамилию и имя клиента, его паспортные данные, сумму и дату выдачи кредита. В дальнейшем эта информация может быть использована для автоматизации бизнес-процессов, например, при добавлении нового клиента в базу данных, — пояснила Ольга Леванова. Алгоритм извлекает из документов так называемые в компьютерной лингвистике «именованные сущности». Это определенные смысловые фрагменты из текста, то есть информация, которую можно именовать конкретной категорией — фамилии, адреса, даты, валюты, города и улицы и многое другое. — Для обучения программе необходимо получить набор размеченных текстов, где выделены интересующие пользователя сущности. После этого модель способна выделять те же сущности, для новых, неразмеченных документов, — отметила доцент Демидовского университета. Действие программы уже успешно апробировали на массиве открытых данных судебных решений, а также текстовых документах университета. Сейчас команда разработчиков изучает алгоритмы и решения других нейросетей, созданных за последние полтора года, чтобы улучшить собственную модель. 
