Тема: Теоретические основы индексирования документов. Методы индексирования документов Быстрый и качественный поиск

Индексирование –процесс выражения содержания документа и
(или)запроса на информационно-поисковом языке (ИПЯ)с помощью
терминов индексирования– классификационных индексов, предметных
рубрик (ПР), ключевых слов, дескрипторов, кодов. Иными словами,
индексирование – процесс перевода содержания документов и запросов с
естественного языка на ИПЯ, в результате чего создается поисковый образ
документа (ПОД) и поисковый образ запроса (ПОЗ). Таким образом,
происходит «свертывание» информации, содержащейся в документе, и
изложение ее на ИПЯ в виде индекса, предметной рубрики или
дескриптора, ключевого слова

Информационно-поисковый язык (ИПЯ) –это специально созданный
искусственный язык, предназначенный для выражения содержания
документов и (или) запросов с целью их последующего поиска. ИПЯ – это
основной элемент логико-семантического аппарата информационнопоисковой системы (ИПС)
Основные требования, предъявляемые к ИПЯ:
· Однозначность;
· Достаточная семантическая сила
· Открытость (возможность корректировки языка)

Каждый ИПЯ имеет определенный словарный состав, представляющий
совокупность лексических единиц (ЛЕ) – обозначения отдельного
понятия, минимального и неделимого в этой функции. В качестве ЛЕ в
ИПЯ используется лексика естественных языков – слова, словосочетания
предметной рубрики, цифровые или буквенно-цифровые коды и т.д.
Важным моментом при индексировании является создание поискового
образа документов (ПОД).Поисковый образ документа– основное
смысловое содержание документа (а не вся информация, содержащаяся в
нем), выраженное в терминах формализованного ИПЯ. ПОД ставится в
однозначное соответствие этому документу, по нему производится
отыскание документов в массиве документов.

Идексирование запроса также осуществляется путем перевода его
содержания на ИПЯ. Таким образом, совокупность терминов
индексирования, выражающих смысловое содержание запроса, называется
поисковым образом запроса (ПОЗ).
Поиск ведется по совокупности терминов индексирования. С целью
повышения эффективности поиска информации по запросу ПОЗ может быть
дополнен специальными указаниями о последовательности выполнения
логических операций в процессе информационного поиска, которые
называются поисковым предписанием.

Индексирование реализуется в следующих процессах: предметизации,
систематизации и координатном индексировании.
Систематизация –вид индексирования, при котором содержание документа
и (или) запроса выражено классификационными индексами, в соответствии с
правилами определенного классификационного ИПЯ (КС). Такой принцип
индексирования принято считать классификационным. Он обеспечивает
возможность организации информационного поиска по иерархическому
признаку. Специалисты, осуществляющие процесс систематизации в
библиотеках и информационных центрах, называются систематизаторами

Предметизация– вид индексирования, при котором содержание документа и (или)
запроса выражено предметной рубрикой (ПР) в соответствии с правилами определенного
предметизационного ИПЯ. Предметизационный принцип индексирования основан на
использовании ЛЕ, которые входят в состав предметных рубрик, естественного языка (т.е.
предметные рубрики, выражающие ПОД и ПОЗ составляются на основе естественного
языка). Предметизационный принцип индексирования обеспечивает возможность
организации информационного поиска по алфавитному признаку. Процессы
предметизации осуществляются в библиотеках и информационных центрах
предметизаторами.
Координатное индексирование –вид индексирования, при котором смысловое
содержание документа и (или) запроса многоаспектно выражаются множеством ключевых
слов или дескрипторов. ИПЯ, предназначенный для координатного индексирования,
называется дескрипторным языком. Специалисты, осуществляющие координатное
индексирование, называются индексаторами.

.
Итак, в зависимости от вида индексирования, выделяются
предметизационные, классификационные и дескрипторные ИПЯ. В их
состав входит множество ЛЕ и грамматические (парадигматические и
синтагматические) отношения между ними. ЛЕ – обозначение отдельного
понятия, принятое в ИПЯ и неделимое в этой функции. ЛЕ могут
представлять собой принятые в естественном языке слова, устойчивые
словосочетания, аббревиатуры, символы, даты, общепринятые сокращения,
лексически значимые компоненты сложных слов, а также эквивалентные им
кодовые или символические обозначения искусственного языка.
Грамматические отношения позволяют организовать ЛЕ в систему.

Требования к ИПЯ:
· Полно и точно передавать содержание документа, отражаемого в данной ИПС;
· Обеспечить однозначное толкования терминов индексирования;
· Допускать многоаспектное индексирование;
· Допускать внесение изменений (дополнений, исправлений);
· Обеспечивать простоту и удобство индексирования, информационного поиска и
ведение данной ИПС;
· Отражать современное состояние терминосистемы в данной области знания.

10.

Необходимость создания искусственного языка (для
выражения смыслового – семантического содержания
документов с целью их поиска) обусловлена тем, что
естественный язык обладает рядом свойств,
препятствующих его использованию для записи и поиска
информации: это неоднозначность и многозначность слов
естественного языка. Точное значение многих слов можно
определить только из контекста, в котором они
употреблены (ударный инструмент, ударная доза и т.д.).
Эти факторы не позволяют добиться точного соответствия
между содержанием документа и средствами выражения
этого содержания.
Трудности использования естественного языка в качестве
ИПЯ усиливаются еще и тем, что в ИПС в качестве входных
документов могут быть использованы не полные тексты, а
рефераты, аннотации, библиографические описания,
которые являются результатом свертывания содержания
документов.

Индексирование документов - это задача присвоения им неких метаданных, позволяющих быстро классифицировать, сортировать и искать информацию в архиве без просмотра самого документа. Наиболее простой формой индексирования документов является ввод информации в карточку поиска документов, созданных по определенным критериям.

Пример карточки поиска

  • название документа;
  • дата документа;
  • вид документа, и т.д.

При этом критериев может быть сколько угодно.

Для чего это нужно

Развитие электронной формы хранения документов требовало новых подходов к индексированию данных ещё в конце 90-х годов прошлого века. Развитие поисковых систем и лингвистических методов дало массу возможностей для построения обратных словарей документов и других систем классификации и поиска на основе конкретных текстов, но инструментов внешней (экспертной) классификации разработано не было. В 1996 году были предприняты первые попытки разработки механизма автоматического индексирования документа на основании его содержания, то есть присвоения логических связок.

Решение для поиска документов

Эксперимент, основной целью которого было изучение возможностей индексирования документов, проводился на базе Российской Национальной Библиотеки. Основа алгоритма индексирования документов - выделение ключевых слов, характерных для специфической области, к которой относится документ.

Чем больше количество информации, тем сложнее найти конкретный документ. Для того что бы сократить время поиска того или иного документа, его нужно проиндексировать.С помощью индексирования документов, поиск информации в массиве из 1 миллиона листов занимает около 3 секунд. Без индексирования это могло бы занять целый месяц.

Грамотное индексирование

Если Вам нужно проиндексировать документы, лучше всего сделать это, обратившись к специалистам. Обращайтесь к нам, наши специалисты имеют большой опыт работы по вводу данных. Стоимость этих услуг всегда дешевле чем, заниматься этим без специальных навыков.

Индексирование документов

(Систематизация, предметизация, координатное индексирование)

Индексирование – это выражение содержания документа и/или смысла информационного запроса на информационно-поисковом языке (ГОСТ 7.74-96). Выделяют три вида индексирования документов: классификационное (систематизация), предметное (предметизация), координатное (координатное индексирование).

Предметное индексирование – индексирование предметного содержания документа, выраженное языком предметных рубрик.

Классификационное индексирование – систематизация документов посредством понятий и кодов какой-либо классификационной системы.

Координатное индексирование – индексирование, предусматривающее многоаспектное выражение основного смыслового содержания информационного запроса множеством ключевых слов или дескрипторов.

Название поля

Указания

Классификационный индекс, определенный по таблицам ББК

Индексы другой классификации, используемой библиографирующим учреждением, например, ТБК или таблицы для краеведческих документов

Определяется по встроенной таблице Хавкиной. Автоматически проставляется после сохранения при наличии классификационного индекса

903: Шифр документа в БД

Идентификатор документа, строится автоматически

906: Систематический шифр

Расстановочный шифр, определяемый библиографирующим учреждением

60: Раздел знаний

Порядковый номер, включающий название отрасли в целом

Краткая формулировка темы на естественном языке

Предметный заголовок

Первый элемент многочленной предметной рубрики

1-й подзаголовок

Конкретизируют основные характеристики, состав, состояние, свойства и т. д. предмета, выраженного заголовком предметной рубрики

2-й подзаголовок

Детализирует аспекты рассмотрения предмета, выраженные в 1-м подзаголовке предметной рубрики

Эффективность

3-й подзаголовок

Детализирует аспекты рассмотрения предмета, выраженные во 2-м подзаголовке предметной рубрики

Математические расчеты

Географический подзаголовок

Отражают географический (территориальный) аспект рассмотрения предмета, показывают его связь с определенной территорией

Географический подзаголовок

Географический подзаголовок

Хронологический подзаголовок

Конкретизируют период времени или определенную дату. Обозначают арабскими цифрами, словесными формулировками эпохи и периодов

2005–2008 гг.

20 в., вторая половина

610: Ненормированные ключевые слова

Ключевое слово (словосочетание из текста документа), которое несет в данном тексте существенную смысловую нагрузку с точки зрения информационного поиска. Целесообразно использовать КС для дополнительного раскрытия содержания документа на более глубоком уровне, т. е. использовать ПР для описания основных предметов документа и их аспектов, КС – для их дальнейшей детализации а также описания побочных тем документа. Выбираются непосредственно из текста документа и вводятся в данное поле, если они отсутствуют в заглавии и предметной рубрики

Писатели

Доплера эффект

Оздоровительные лагеря

600: Персоналия

(о нем) – имя лица

Предметная рубрика, заголовком которой является имя лица, если оно является предметом рассмотрения в документе. Содержит подполя, аналогичные полям 700 «Автор» и 701 «Другие индивидуальные авторы»

Фамилия, инициалы

Расширение инициалов

Татьяна Григорьевна

Неотъемлемая часть имени

Дополнения к именам, кроме дат

Д-р филол. наук (фольклорист), лауреат Гос. премии УР (2004)

Даты жизни

Разночтение фамилий

Персоналия (о нем)

Записывается в одну строчку полное наименование организации

Ижсталь, спортивная команда по хоккею

331: Аннотация

Краткая характеристика документа, поясняющая его содержание, назначение, форму, другие особенности

Процесс индексирования включает следующие этапы:

– выявление основных компонентов содержания документа,

– представление выявленных компонентов содержания средствами информационно-поисковых языков.

В процессе индексирования учитываются:

– информационные потребности пользователей,

– общая и частные методики индексирования.

Предметные рубрики (ПР), присвоенные документу, должны отражать содержание каталогизируемого документа с максимальной полнотой и точностью. Как правило, документу следует присваивать адекватные ПР, формулировка которых выражает объем понятия, наиболее точно соответствующий объему понятия о предмете документа. Обобщающие рубрики, которой выражает объем понятия более широкий, чем объем понятия о предмете документа, присваиваются в том случае, если нерационально использовать адекватные ПР.

Количество ПР, присвоенных документу, может быть различным и зависит от содержания каталогизируемого документа. Индексатор может присвоить документу одну или несколько ПР.

Новые предметные рубрики создаются при наличии документов соответствующей тематики. Для формулирования новых ПР следует использовать термины, соответствующие современному состоянию терминосистем. Использование терминологии должно основываться на

§ отраслевых энциклопедиях;

§ современных терминологических словарях;

§ каталогизируемых документах.

Правила формулирования предметной рубрики

1. В состав ПР могут входить все части речи , но основной языковой формой выражения понятий в ПР являются имена существительные и словосочетания на их основе. Наличие существительного в ПР обязательно.

2. Заголовок и подзаголовки предметных рубрик формулируются в именительном падеже . При инверсировании словосочетаний может применяться родительный падеж . Например: Ома закон.

3. Слова, используемые в предметной рубрики, формулируются во множественном числе . Исключение представляют термины, которые не употребляются во множественном числе. Например: Транспорт. Дыхание. Единственное число принято и для тех слов, которые во множественном числе обозначают другое понятие. Например: Театр – как вид искусства и Театры – как вид учреждения.

4. При употреблении предмета в полной и краткой форме предпочтение отдается полной форме. Исключение составляют слова у которых краткая форма вытеснила полное наименование предмета и сокращение вошло в терминологию. Например: КПСС, ЮНЕСКО.

5. При использовании в формулировке предметных рубрик многозначных слов и слов-омонимов в скобках указывать слова, уточняющие содержание понятия (реляторы). Например: Представления (гносеол.) и Представления (мероприятия).

6. Для того, чтобы в позиции ведущего слова предметной рубрики находилось слово, несущее максимальную смысловую нагрузки, возможно применение инверсии. Инверсия применяется в следующих случаях:

6.1. В отношении таких понятий, как теорема, теория, метод, задача, эффект, явление и т. д. Например: Вероятностей теория, Ферма теорема.

6.2. В отношении так называемых «нехарактерных» прилагательных. В этих случаях существительное является основным словом, определяющим сущность предмета, а прилагательное обозначает не основные свойства предметов, а их частные вторичные признаки

К таким признакам относятся:

– некоторые нехарактерные внешние признаки (величина, объем, форма, цвет и т. д.). Например: Строительные конструкции легкие.

физические свойства и состояния (твердый, жидкий, сухой и т. д.). Например: Пищевые продукты жидкие.

– некоторые количественные, пространственные и временные определения и отношения. Например: Музыкальные фестивали международные.

Исключениями являются те случаи, когда нехарактерное само по себе прилагательное является частью общепринятого термина. Например: Внешняя торговля.

6.3. В случае, если имя собственное входит в географическое название.

Например: Лаптевых море.

Правила формулирования географического термина

1. При формулировании географического термина, вводимого в словарь, следует использовать исторически сложившиеся, более краткое общеупотребительное название государства. Развернутые официальные названия государств используются только при отражении юридической литературы. Например: Конституция – Российская Федерация.

Географическое наименование должно соответствовать историческому периоду, рассматриваемому в документе. Например:

Вятская губерния

Устинов, город.

2. Названия всех географических объектов должны иметь уточнения, к какой категории географических объектов они относятся (город, остров, река и т. д.). Эти уточнения записываются без сокращений через запятую и пробел после наименования объекта. Например.

Индексирование документов - это сложный информационно-технологический процесс, с помощью которого становится возможен поиск данного документа поисковыми системами.

Где используется индексирование документов

Индексирование широко применяется поисковыми системами. Также может применяться и локальными программами, например, электронными архивами. Индексирование документов заключается в их описании специальными информационно-поисковыми терминами, в итоге каждому документу присваивается определённый набор ключевых слов, отражающих его смысловое наполнение.

Дополнительные настройки

Индексирование документов в большинстве электронных архивов происходит автоматически, но в той или иной степени требует дополнительных настроек. Например, автоматическое индексирование документов может происходить при помощи специального словаря тезариуса и будет называться контролируемым, а может быть свободным.

Когда делают индексирование:

  • При работе с базами данных;
  • При работе с электронными архивами;
  • При работе с CRM системами.

Недостаток свободного индексирования

Недостатком свободного индексирования перед контролируемым является то, что в текстах документов будут обнаруживаться слова без учёта изменений их форм. Кроме того, для расширения поиска в тезариус возможно включать синонимы ключевых слов и словосочетаний. Также стоит упомянуть, что индексирование документов может быть автоматизированным и координатным, что во много раз расширяет возможности поиска. Между этими видами индексирования документов существуют немалые различия, но они оба предусматривают некое интеллектуальное решение поисковой машины, позволяющее ей более подробно и многосторонне взглянуть на смысловое содержание документа.

Быстрый и качественный поиск

Если рассматривать индексирование документов относительно бумажных архивов, то здесь значение этого словосочетания меняется и означает классификацию документов. Индекс такого документа включает в себя несколько цифр, например: порядковый номер документа, номер структурного подразделения, номер номенклатуры и т.п.

ГОСТ

Индексирование бумажных документов производится в соответствии с ГОСТом, но в конечном итоге преследует ту же цель, что и индексирование электронной документации – облегчение поиска необходимой информации, необходимого документа. Наша компания уже много лет занимается индексированием документов. Если вас заинтересовала данная услуга обратитесь к нашим специалистам.

Статьи

Сукиасян Э.Р.
Школа индексирования. Занятие 1. Стандартные требования к индексированию

[ Библиотека. – 2004. – № 2. – С. 50-52 ]

С января 2ОО4 г. в нашей стране введен в действие непосредственно в качестве Государственного стандарта Российской Федерации ГОСТ 7.59–2ООЗ «СИБИД. Индексирование документов. Общие требования к систематизации и предметизации». Стандарт принят органами по стандартизации Азербайджана, Армении, Белоруссии, Грузии, Казахстана, Киргизии, Молдавии, Таджикистана, Туркмении, Узбекистана.
Индексирование – новое слово? Возможно, для части библиотекарей, работающих в публичных библиотеках. Все мы всегда занимались индексированием – оно включает в себя: систематизацию (без которой не обходится ни одна библиотека), предметизацию, координатное индексирование. ГОСТ 7.74 дает следующее определение этого термина: «Индексирование – выражение содержания документа и/или смысла информационного запроса на информационно-поисковом языке».
Новое для широкого круга библиотекарей понятие появилось в названии ГОСТ 7.59–90, введенного впервые в 1991 г. Тогда в профессиональной печати были опубликованы методические рекомендации, положения стандарта изучались библиотечными работниками. Введение стандарта было своевременным и необходимым. Его основные требования вошли в учебные пособия, инструкции и положения, общегосударственные нормы времени на основные процессы библиотечной работы.
Прошло более десяти лет. За эти годы изменилась классификационная практика в стране. Потребовалось уточнить перечень и наименования классификационных систем. Существенно упорядочена терминология рассматриваемой предметной области. Были утверждены терминологические стандарты 7.73–96, 7.74–96 и 7.76–96, в которые вошли многие из тех терминов, приведенных в стандарте 7.59–90. Изменилось оформление стандартов вообще – они стали межгосударственными.
Существенно обновился за этот период кадровый состав библиотек. В отделах, занимающихся каталогизацией и обработкой документов, появились сотни новых сотрудников. Если даже они имели библиотечное образование, возникла необходимость овладеть новой системой терминов, обновить технологические знания, изучить рекомендованные стандартами приемы и алгоритмы. Тем, которые специальной подготовки не имели, нужно заниматься более целенаправленно и углубленно. Каталогизация такая область библиотечной практики, где самодеятельность недопустима, есть определенные документы (стандарты, нормы, правила, обязательные инструкции), без знания и строго выполнения которых сегодня работать нельзя.
Еще пока не везде, но уже во многих библиотеках появились автоматизированные системы и электронные каталоги. Вместе с ними в нашу повседневную жизнь пришли новые понятия и правила индексирования.
Задачи школы
В связи с введением в действие ГОСТ 7.59–2003 возникло предложение организовать на страницах «Библиотеки», самого массового профессионального издания в нашей стране, заочной Школы индексирования. Мы планируем публиковать материалы этой рубрики постоянно, из номера в номер. Ознакомим с историей разработки стандарта. Поясним, как должен быть связан стандарт с правилами, инструкциями, учебными и практическими пособиями. Глубоко познакомим с терминами и их стандартными определениями. Последовательно разберем общие требования к индексированию документов. Специальные занятия посвятим информационно-поисковым языкам – классификационным, предметизационным, дескрипторным. Подробно рассмотрим принципы, общие требования и правила систематизации, предметизации, координатного индексирования.
Заочная школа предполагает обратную связь со слушателями. Вести занятия буду я, Эдуард Рубенович Сукиасян. Мне можно написать по электронной почте (E-mail: [email protected]) или на адрес редакции журнала.
Предшественники ГОСТ 7.59–2003
Любой стандарт рождается в результате обобщения многолетней практики. Библиотекари учились по учебникам, использовали практические пособия. Стандартов, регламентирующих технологические процессы, многие десятилетия не было. Появление централизованной каталогизации (например, печатной каталожной карточки), общая для всех или многих библиотек система классификации понемногу привели библиотекарей к пониманию целесообразности единых принципов и методов работы. На определенном этапе развития международных связей возникла необходимость максимального согласования отечественной практики каталогизации с зарубежной.
В декабре 1985 г. Международная организация по стандартизации (ИСО), активным членом которой была наша страна, утвердила Международный стандарт 5963 «Документация – методы анализа документов, определения их тематики и выбора терминов индексирования». МС ИСО 5963 по своему содержанию почти полностью совпадал с введенными с 01.01.1985 г. в СССР двумя стандартами: ГОСТ 7.44–84 «СИБИД. Систематизация документов. Общие требования» и ГОСТ 7.45–84 «СИБИД. Предметизация документов. Общие требования». Интересно: требования международного и отечественных стандартов совпадали в деталях, но наши стандарты оказались более четкими, формализованными, содержали некоторые положения, совершенно отсутствующие в МС ИСО. Сказался опыт: в нашей стране первый учебник вышел в 1947 г., многократно пересматривались разного рода инструкции и положения.
Вместе с тем в МС ИСО 5963 обнаружились несомненные достоинства, пренебрегать которыми не хотелось. Самостоятельной частью стандарта были определения встречающихся в нем терминов. В отечественной практике задачи стандартизации терминологии решались отдельными стандартами. В частности, для рассматриваемой области уже был утвержден ГОСТ 7.39–82 «СИБИД. Систематизация и предметизация. Термины и определения (введен с 01.01.1984 г.). Более интересной оказалась другая особенность МС ИСО. В нем вводились понятия и определялись требования общего характера, охватывающие как систематизацию, так и предметизацию. Отечественные ГОСТ 7.44 и 7.45 разрабатывались одним и тем же авторским коллективом, но не имели общей части и не были согласованы в деталях. Мы и не ставили такой задачи, разрабатывая два самостоятельных стандарта.
Преимущества МС ИСО были очевидны: проще освоить любой процесс, тем более – совокупность сложных процессов, какими являются систематизация и предметизация, выделив общее, единичное и особенное. Поэтому было решено объединить два отечественных стандарта, максимально приблизить их к МС ИСО 5963 по структуре и содержанию. В коллективе разработчиков были представлены и крупнейшие библиотеки, и библиографирующие центры, и органы информации. Надо было разработать такой стандарт, применение которого не ограничивалось бы ведомственными рамками. Это значило, что предстояло решить ряд сложных терминологических проблем: в эти годы в стране параллельно функционировали две системы терминов – библиотечная и информационная. Было решено использовать в стандарте современную международную терминологию. Мы пришли к выводу, что рано или поздно противоречия и несогласованности терминологии внутри страны будут урегулированы, жизнь заставит нас принять международные нормы. Впоследствии наша гипотеза полностью оправдалась.
ГОСТ 7.59–90 оказался не единственным, созданным на основе МС ИСО 5963. Спустя несколько лет был разработан и с 01.01.1993 г. введен в действие его «собрат» – ГОСТ 7.66–92 «СИБИД. Индексирование документов. Общие требования к координатному индексированию».
Что было нового
В период разработки ГОСТ 7.59–90 было проведено серьезное научное исследование. Разработчики хотели выяснить, не считают ли библиотекари некоторые требования стандарта 7.44–84 слишком жесткими, неправомерными. Стандартом предусматри-валось обязательное ведение во всех библиотеках алфавитно-предметного указателя к систематическому каталогу (АПУ) – не в качестве вспомогательного аппарата, а в роли составной части каталога. Поэтому предписывалось составление карточки АПУ в процессе обработки новых поступлений. Это требование основывалось на современных представлениях о том, что систематический каталог способен выполнять свои функции, если он обеспечен адекватным АПУ. Иначе говоря указатель отражает содержание фактически существующих в фонде документов, представленных в каталоге, а поступающих в фонд – в процессе их обработки. Вводилось также обязательное редактирование классификационного решения и предметных рубрик АПУ, ведение систематической контрольной картотеки (СКК) к АПУ. Соответственно были изменены общегосударственные нормы времени.
Обследование показало, что сотни библиотек так уже работали, и ничего оригинального, нового стандарт не вносил. Дело в том, что указанные процессы становились обязательными. Выявилось четкое соответствие между наличием и качеством АПУ в библиотеке и количеством обращений к каталогу. Там, где каталог «существовал без адекватного АПУ, он оставался «вещью в себе». Там, где АПУ просто перепечатывался с таблиц классификации, каталогом пользовались с трудом (новая тематика в нем не отражалась). Если же библиотека постоянно вела АПУ, читатель эффективно работал с каталогом.
Новой, конечно, была терминология. Если взять учебники 1940–1950-х гг., то там многих терминов, которыми успешно оперируем сегодня, мы не встретим. Каждая эпоха обогащает наш профессиональный язык. Но если взять ГОСТ 7.59, мы вправе говорить не столько об «обогащении», сколько об уточнении понятий. Впрочем, практика показала, что новая терминология прижилась быстро. Наибольшие трудности возникли с понятием «термин индексирования» (indexing term), разобраться в котором нам еще предстоит.
Структура ГОСТ 7.59–2003
В соответствии с современными требованиями стандарт состоит из 6 разделов. В первом («Область применения») говорится (здесь и далее текст стандарта будет цитироваться без каких-либо изменений и выделяться особым шрифтом):
Настоящий стандарт устанавливает общие требования к индексированию: систематизации и предметизации документов и информационно-поисковым языкам, применяемым при индексировании. Стандарт предназначен для библиотек, органов научно-технической информации, книжных палат, редакций и издательств.
Затем следует довольно обширный раздел «2 Нормативные ссылки»:
В настоящем стандарте использованы ссылки на следующие стандарты:
ГОСТ 7.66–92 (ИСО 5963-85) Система стандартов по информации, библиотечному и издательскому делу. Индексирование документов. Общие требования к координатному индексированию.
ГОСТ 7.73–96 Система стандартов по информации, библиотечному и издательскому делу. Поиски распространение информации. Термины и определения.
ГОСТ 7.74–96 Система стандартов по информации, библиотечному и издательскому делу. Информационно-поисковые языки. Термины и определения.
ГОСТ 7.76–96 Система стандартов по информации, библиотечному и издательскому делу. Комплектование фонда документов. Библиографирование. Каталогизация. Термины и определения.
Очень ценным является раздел «3 Определения», в котором после слов «В настоящем стандарте применяют следующие термины с соответствующими определениями…» дан перечень 45 терминов, большая часть – со ссылками на указанные выше терминологические стандарты, а на 16 других терминов даны определения здесь же.
Вся дальнейшая структура стандарта будет понятна из приведенной схемы.
Структура ГОСТ 7.59–2003 «СИБИД. Индексирование Документов. Общие требования к систематизации и предметизации»

  1. Область применения
  2. Нормативные ссылки
  3. Определения
  4. Общие положения 4.1 Сущность индексирования 4.2 Объект индексирования 4.3 Условия индексирования 4.4 Принципы индексирования 4.5 Виды ИПЯ и терминов индексирования
  5. Требования к ИПЯ 5.1 Общие требования 5.2 Требования к классификационным ИПЯ 5.3 Требования к предметизационным языкам
  6. Технологические процессы и общие правила индексирования 6.1 Общие правила индексирования 6.2 Правила систематизации 6.3 Правила предметизации

Мы начнем наши занятия с раздела 4 «Общие положения». Все терминологические пояснения будут даны по мере необходимости.

Please enable JavaScript to view the