Картотека документов

Электронный фонд правовой
и нормативно-технической документации

ISO 24614-2-2011 Language resource management — Word segmentation of written texts — Part 2: Word segmentation for Chinese, Japanese and Korean Управление ресурсами языка — Сегментация слов письменных текстов — Часть 2: Сегментация слов для китайского, японского и корейского языков

Название документа
ISO 24614-2-2011 Language resource management — Word segmentation of written texts — Part 2: Word segmentation for Chinese, Japanese and Korean Управление ресурсами языка — Сегментация слов письменных текстов — Часть 2: Сегментация слов для китайского, японского и корейского языков
Вид документа
Принявший орган
Статус
Скрыто
Дата принятия
Скрыто
Дата начала действия
Скрыто

Документ «ISO 24614-2-2011 Language resource management — Word segmentation of written texts — Part 2: Word segmentation for Chinese, Japanese and Korean» устанавливает стандарты для сегментации слов в текстах, написанных на китайском, японском и корейском языках. Основное назначение документа — улучшение качества обработки и анализа текстов на указанных языках, что имеет особое значение в области обработки естественного языка, разработки программного обеспечения и лингвистического исследования.

Стандарт охватывает ключевые аспекты, включая методы сегментации, параметры, требования и процедуры, необходимые для точной и консистентной обработки языковых данных. Он также регламентирует правила для выбора правильных алгоритмов и моделей, которые могут использоваться для достижение оптимальных результатов в сегментации слов, основываясь на лексических и грамматических особенностях языков.

Документ содержит важные технические детали, такие как условия тестирования и классификация различных подходов к сегментации, что позволяет лабораториям и производителям оценивать и сравнивать свои методы. Измеряемые величины включают, например, скорость и точность сегментации, что критично для создания конкурентоспособных решений в области технологий обработки текста.

Целевая аудитория стандарта включает разработчиков программного обеспечения, исследовательские лаборатории и контролирующие органы, стремящиеся обеспечить соответствие своих решений современным требованиям в области обработки языков. Стандарт призван служить основой для международного сотрудничества и обмена опытом в данной области, что способствует развитию более эффективных технологий.

Практическое значение стандарта заключается в его влиянии на безопасность данных и качество их обработки. Он способствует повышению совместимости различных программных решений, обеспечивая унификацию подходов к сегментации текста, что в свою очередь влияет на качество созданных лингвистических ресурсов. Стандарт также включает в себя обновления, касающиеся новых методов и технологий, что делает его актуальным для современных потребностей в области обработки языковых данных.

Описание документа носит справочный характер, достоверность этого материала не гарантируется.

Чтобы получить полный доступ к этому и другим документам, приобретайте доступ к Информационной сети «Техэксперт» - лидеру в области комплексного обеспечения предприятий нормативно-технической документацией.

Нормативно-техническая документация (ГОСТ, СНиП, ГН, Р, ГЭСН и др.)
Нормативно-правовые акты органов государственной власти (законы, законопроекты, постановления)
Технологическая документация (чертежи, схемы и др.)
Аналитические материалы
Классификаторы и словари
Справочная информация
Все документы и информация о них
доступны в системах «Техэксперт» и «Кодекс»

Возможно вас заинтересуют

PDF BS ISO 24614-1-2010 Language resource management - Word segmentation of written texts Part 1: Basic concepts and general principles Управление языковыми ресурсами - Сегментация слов письменных текстов Часть 1: Основные понятия и общие принципы PDF BS ISO 24613-5-2022 Language resource management - Lexical markup framework (LMF) Part 5: Lexical base exchange (LBX) serialization Управление языковыми ресурсами - Лексическая маркировочная рамка (LMF) Часть 5: Лексическая база обмена (LBX) сериализация PDF BS ISO 24613-4-2021 Language resource management — Lexical markup framework (LMF) Part 4: TEI serialization Управление языковыми ресурсами — Лексическая маркировочная рамка (LMF) Часть 4: сериализация TEI PDF BS ISO 24615-1-2014 Language resource management — Syntactic annotation framework (SynAF) Part 1: Syntactic model Управление языковыми ресурсами — Синтаксический аннотационный фреймворк (SynAF) Часть 1: Синтаксическая модель PDF BS ISO 24615-2-2018 Language resource management — Syntactic annotation framework (SynAF) Part 2: XML serialization (Tiger vocabulary) Управление языковыми ресурсами — Синтаксический аннотационный фреймворк (SynAF) Часть 2: XML-сериализация (Tiger vocabulary) PDF BS ISO 24616-2012 Language resources management - Multilingual information framework Управление языковыми ресурсами - Многоязыковой информационный фреймворк