Контент анализ. Описание метода контент-анализ Смысловые единицы контент анализа
Контент-анализ – метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах.
Контент-анализ – формализованный метод изучения текстовой и графической информации, заключающийся в переводе изучаемой информации в количественные показатели и ее статистической обработке. Характеризуется большой строгостью, систематичностью. Контент-анализ не отменяет необходимости обычного (т.е. содержательного) анализа документов. Первый дополняет второй, их сочетание углубляет понимание смысла любого текста. Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении, но что имеет важный социальный смысл.
Кроме того, контент-анализ отличается от всех прочих способов изучения документов, тем, что он позволяет «вписать» содержание документа в социальный контекст, осмыслить его одновременно и как проявление, и как оценку социальной жизни. «Вписывание» документа в изучаемую проблему предполагает выявление того, что:
А) существовало до него и получило в нем отражение,
б) наличествует только в нем,
в) будет после него, т.е. явится итогом его восприятия адресатом.
Объект контент-анализа - документы, исследуемое содержание которых, позволяет задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, интересующие исследователя элементы содержания встречаются с достаточной частотой (принцип статистической значимости).
Чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.
Стадии разработки и применения контент-анализа:
Формулируются тема, задачи и гипотезы исследования
Определяются категории анализа – наиболее общие, ключевые понятия, соответствующие исследовательским задачам.
Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. Категории контент-анализа должны быть уместными, т.е. соответствовать решению исследовательских задач; исчерпывающими, т.е. достаточно полно отражать смысл основных понятий исследования; взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме); надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.
Необходимо выбрать соответствующую единицу анализа – лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления. За единицу анализа может быть принято слово, предложение, тема, идея, автор, персонаж, социальная ситуация, часть текста, объединенная чем-то, что соответствует смыслу категории анализа. Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа.
Необходимо установить единицу счета – количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность). Единица счета – количественная мера единицы анализа, позволяющая регистрировать частоту (регулярность) появления признака категории анализа в тексте. Единицами счета могут быть число определенных слов или их сочетаний, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических пространственных величинах и многое другое.
- < Назад
- Вперёд >
Контент-анализ представляет собой формализованный метод сбора данных из вторичных источников и качественно-количественного анализа их содержания. Проведение контент-анализа основано на следующих принципах:
Формализации - необходимо задать однозначные правила для выявления искомых характеристик содержания;
Статистической значимости - интересующие исследователя элементы содержания должны встречаться с достаточной частотой.
Алгоритм выполнения контент-анализа представлен на рис. 16 и состоит из следующих этапов:
1. Постановка задач контент-анализа.
2. Определение системы категорий анализа.
3. Определение единицы анализа.
4. Выбор количественных и качественных характеристик текста, которые интересуют исследователя для характеристики взаимосвязи содержания с внешними параметрами.
5. Выбор источников для обследования.
6. Разработка таблиц сбора данных на каждую категорию анализа.
7. Разработка инструкций кодировщику, где описывается система правил сбора эмпирических данных, пояснения для правильного понимания персоналом процедур регистрации заданных единиц анализа, алгоритм действий.
8. Сбор информации.
9. Обработка результатов и их интерпретация.
10. Подготовка отчета.
Объектом анализа могут выступать материалы газет и других печатных изданий, содержание радио- и телепередач, кинофильмов, рекламных обращений, а также данные, полученные посредством открытых вопросов анкет или свободных интервью.
Цель исследования - выявление аспектов, касающихся объекта и предмета исследования, которые получили подробное рассмотрение в документах, вышедших в течение некоторого периода времени. Например, изучение общественного мнения по поводу нового закона о проблемах ЖКХ.
Рис. 16. Алгоритм контент-анализа
В зависимости от целей исследования можно выделить несколько типов контент-анализа:
Первый тип контент-анализа: подсчет символов (ключевых слов), содержащихся в материалах (например, упоминание торговой марки или названия фирмы);
Второй тип: дальнейшая проработка первого - это классификация символов по отношению авторов публикаций к изучаемому объекту (в положительном или отрицательном смысле);
Третий тип: анализ по элементам содержания - классификация отдельных частей документов по заданным критериям.
Четвертый тип: тематический анализ - выявление явных и скрытых тем публикаций.
Пятый тип: структурный анализ - выявление взаимоотношений различных тем публикаций. Эти отношения могут быть взаимодополняющими, развивающими одну тему, и конфликтными (когда темы работают на взаимно противоположные цели).
Шестой тип: анализ взаимоотношений различных материалов, имеющих общую цель публикаций, кроме вопросов пятого типа контент-анализа, - здесь изучается последовательность появления публикаций и отслеживается динамика характеристик содержания во времени (например, изучение реакции на предвыборную агитацию).
Категория контент-анализа - это наиболее общие, ключевые понятия, позволяющие группировать затрагиваемые темы в содержании сообщения в соответствии с выбранной классификацией (например, по проблематике), что позволяет идентифицировать содержание материалов в общем виде. Категория анализа имеет то же назначение, что и вопросы в анкете, т. е. призвана указывать характер получаемых данных.
К процедуре формирования категорий анализа предъявляются определенные требования:
Одни и те же элементы содержания не должны быть отнесены к различным категориям;
Не должно быть разногласий по поводу отнесения элемента содержания к той или иной категории, т. е. категории должны быть надежными.
Единица контент-анализа - это элемент содержания, некоторая его смысловая часть, которая раскрывает определенную категорию. Чтобы определение категории было надежным, необходимо перечислить все единицы анализа или индикаторы их присутствия (признаки наличия определенного элемента содержания). Это могут быть определенные термины, слова, выражения, предложения, имена, темы и т. д. Единицы анализа могут включать в себя оценки отношения (хорошо/ плохо) или оценки эффективности (выгодно/невыгодно) к анализируемым элементам содержания.
Если продолжить рассмотрение примера об изменении законодательства по ЖКХ, то в качестве основных категорий анализа можно выделить:
Проблемы, вынуждающие к изменению законодательства;
Ожидаемые положительные перемены, вызванные изменением законодательства;
Ожидаемые отрицательные перемены, вызванные изменением законодательства;
Конкретные предложения по совершенствованию законодательства.
Расшифровка категории «ожидаемые отрицательные перемены, вызванные изменением законодательства о «ЖКХ» может быть дана с помощью таких единиц: «квартиры скупят «новые русские», «народ попадет в кабалу» т. д.
В исследованиях сообщений средств массовых коммуникаций, где контент-анализ применим наиболее широко, выделяются некоторые «стандартные» смысловые единицы:
Понятие, выраженное отдельным словом, термином или сочетанием слов. Применение такой смысловой единицы целесообразно при изучении способов, посредством которых источник информации организует сообщение, передает свои намерения тем, кому оно направлено, например в рекламе.
Тема, выраженная в единичных суждениях, смысловых абзацах, целостных текстах. Тема является важной смысловой единицей при анализе направленности интересов, ценностных ориентации, установок тех, кто передает сообщение. Однако определение темы бывает затруднено в связи с ее неясностью в тексте. Аналитику приходится определять тему и ее границы внутри текста. Выбор темы в качестве единицы анализа подразумевает также внутреннее разделение текста на определенные части (единицы контекста), в рамках которых тема может быть определена.
Имена людей, географические названия, торговые марки, названия организаций, упоминание какого-либо события. Частота и длительность временного интервала, с которыми они присутствуют в сообщениях, могут послужить показателями их важности, значимости.
Контент-анализ представляет измерения социальных объектов. В социологии измерение означает поиск упорядоченной классификации. Существует множество способов измерения (ранжирование, шкалирование и т.д.). Контент-анализ есть приспособление процедуры измерения к содержанию различных документов.
Первое упоминание о применении специальной техники для анализа содержания текстов относится к середине XVII столетия. В это время внимание исследователей было направлено, в основном, просто на подсчет тем. Объектом исследования долгое время служили, в основном, тексты, связанные с религиозной жизнью населения. Например, в XVH-XVIII вв. измерялась частота появления тем, связанных с именем Иисуса Христа (данные исследований использовались для принятия решений о еретичности книги).
В дальнейшем при измерении содержания документов начинают использовать относительные частоты, которые вычисляются как отношение абсолютной частоты к длине анализируемого текста. При этом в зависимости от того, что является переменной содержания, под длиной текста может пониматься как количество слов в данном тексте, так и количество предложений, количество абзацев, количество любых других единиц анализа текста.
Затем появилось понятие категории. В качестве категории может выступать набор слов, объединенных по определенному основанию. Посредством категорий уже представляются определенные концептуальные образования. Например, в посланиях того или иного президента можно выделить категории ЭКОНОМИКА (слова -безработица, инфляция и др.), СЕМЬЯ (родители, мать, отец, ребенок и др.) и т.д. Вычисление частоты встречаемости категорий позволяет судить о внимании, которое уделяется в послании тем или иным вопросам.
Как отмечает В.И. Шалак, по мере развития и масштабов применения данного метода были внесены и другие категории. Так, относительные частоты требуют сравнения двух и более текстов, но иногда требуется вывести то или иное заключение на основе исследования всего лишь одного текста. При этом вводится некоторая норма, которая служит нулевой отметкой измеряемой характеристики данного текста (степени лояльности, степени агрессивности и т.д.). Исчисление нормы основывается на частоте проявления лояльности, частоте употребления агрессивно окрашенных слов средним носителем данного языка и т.д. Основой для расчета нормы могут быть частотные словари.
При сравнении нормы с проявляемой лояльностью, агрессивностью и т.п. в данном тексте мы получаем отклонения в ту или иную сторону, по которым можем судить о большей или меньшей лояльности, агрессивности или любой другой характеристике текста (выступления политика и т.п.). Кроме того, статистическая оценка (z-score = N-E/стандартное отклонение, где N - количество слов данной категории, реально встретившихся в тексте, Е - ожидаемое число вхождений слов данной категории в текст, которое вычисляется умножением нормальной частоты категории на число слов в анализируемом тексте) позволяет определить значимость отклонения частот. «Представим, что мы хотим оценить степень агрессивности выступления не депутата, а профессионального военного. Очевидно, что норма для него будет отличаться от нормы для среднего человека. Поэтому для оценки агрессивности профессионального военного требуются другие нормы, которые могут быть получены путем дополнительной статистической обработки представительной выборки текстов, характерных для военной среды».
Последующее развитие контент-анализа характеризуется введением все более тонких методов анализа текстов. Например, к середине ХГХ в. внимание исследователей сосредотачивается не на простом наличии или отсутствии категорий в тексте, а на связях между ними. Для этого исчисляется совместная встречаемость слов различных категорий (обычный коэффициент корреляции). «Во второй половине XX в. западными авторами был предложен ряд ставших классическими вариантов методики контент-анализа, наиболее интересными среди которых являются «Анализ неслучайных связей» (Ч. Осгуд); «Система саов» (Р. Икера); «Анализ регрессии» (К. Лоранца); «Анализ высказываний» (С. Вейман), автоматизированная система «Дженерал Инквайрер» (Гарвардский университет), а также более поздние работы ГДалера и Г. Лаклера (анализ речей канадских и французских политиков) и работы Д. Рулофа и Д. Фрайа (анализ отношений Восток-Запад в период разрядки)». 6
Широко известен случай применения данных контент-анализа для судебного преследования некоторых редакторов газет в США за информационное пособничество нацистам. В частности, Г. Лассуэлл и ряд других социологов выступили на суде и представили результаты своих исследований как доказательство подрывной работы ряда газет (так, было подсчитано: в одной из подозреваемых в пронемецких настроениях газет 71% статей описывали слабость союзников по антигитлеровской коалиции).
Другие известные примеры применения контент-анализа в исследовании общественно-политической жизни той или иной страны. В 50-е гг. прошлого столетия западные аналитики на основе контент-анализа передовых статей газеты «Правда» выявили резкое снижение числа ссылок на Сталина. Был сделан вывод о том, что преемники его власти стремятся дистанцироваться от этой фигуры. Далее. В одном из исследований была замечена смена одного из терминов китайской периодики, что послужило индикатором для вывода о переходе к более агрессивному этапу действий Пекина (затем действительно последовала война).
В настоящее время метод контент-анализа продолжает развиваться: большое распространение находит контекстный анализ, или метод нахождения контекстов употребления слов (collocations ), появилось множество версий автоматической категоризации (группа Т. Амака из ФРГ, проект «ВААЛ» 7 в России и т.д.).
Как правило, контент-анализ применяется тогда, когда необходимо исследовать обширный (по объему) и несистематизированный (по какому-либо основанию) текстовый материал. Это означает, что квантификация оправдана, если текстового материала очень много (его нельзя даже охватить без суммарных оценок) и изучаемые качественные характеристики проявляются в тексте достаточно часто. Таким образом, контент-анализ - это перевод массовой документальной информации в количественные показатели с последующей статистической обработкой этой информации.
Суть контент-анализа заключается в переводе вербальной информации в невербальную форму, которая дает некоторые дополнительные объективные измерения того или иного текста. В этом методе содержание коммуникации служит основой для выводов. Как пишет Л.Н. Федотова, «социологический анализ содержания коммуникации состоит в своеобразной «перегруппировке» текста согласно концептуальной схеме исследователя... раздвигаются рамки текста, как объекта анализа для исследователя. Отдельное сообщение перестает быть равным самому себе, перестает иметь (для исследователя!) самодовлеющую ценность, а оценивается как реализация намерений коммуникатора, как характеристика коммуникативной ситуации, как потенциал определенных характеристик аудитории и т.д.». 8 С помощью выявления частоты появления в тех или иных документах определенных характеристик (переменных) исследователь получает точные и объективные данные о намерениях создателя текста, а также о возможных реакциях коммуниканта.
Надо отметить, что анализ документов направлен на изучение общественного мнения не прямо, а опосредованно: через исследование характеристик субъектов (политических партий, политических лидеров, средств массовой информации и т.д.), влияющих на общественное мнение, через изучение применяемых ими средств (публикаций, речей и т.д.), характера и эффективности их воздействия на общественное мнение. Так, контент-анализ широко используется в электоральных социологических исследованиях с целью изучения программных позиций политических партий и общественно-политических организаций, участвующих в избирательных кампаниях, выявления и описания личностных характеристик кандидатов, особенностей «подачи» этих кандидатов в различных СМИ.
На данный момент времени существует множество определений данного метода: статистическая (квантитативная) семантика, техника для объективного количественного анализа содержания коммуникации, техника качественных выводов при помощи установления количественных характеристик сообщения. Каждая из подобных формулировок делает акцент на количественных параметрах анализа текста, но не отражает качественной характеристики контент-анализа. Попытка интегрального определения дается в Социологическом энциклопедическом словаре: «1. Метод качественно-количественного анализа содержания документов с целью выявления имеющихся тенденций развития социальных факторов. 2. Формализованный метод исследования содержания социальной информации посредством выявления устойчиво повторяющихся смысловых единиц текста (названий, понятий, имен, суждений и т.д.)».
Процедура контент-анализа - это последовательность отдельных операций контент-анализа, каждая из которых основана на определенной технике.
Процедура исследования состоит из ряда последовательных операций:
Разработка программы исследования;
Выбор объекта и материала исследования;
Разработка модели выборки;
Разработка системы единиц анализа;
Разработка модели представления содержания текста;
Проведение выборочной операции;
Разработка полевого документа;
Разработка инструкции по проведению полевых работ;
Проведение пилотажных копировочных работ;
Уточнение логической модели предмета анализа, полевого документа и инструкции по проведению полевых работ;
Проведение основных копировочных работ, в том числе разбиение содержания текста на единицы содержания и классификация их по категориям анализа;
Разработка программы обработки полевой информации;
Обработка полевой информации;
Разработка макета представления количественных результатов исследования;
Изготовление итоговых таблиц;
Первичный анализ полученной аналитической информации.
Существуют три вида операций, которые реализуют процедуру контент-анализа: 1) по разработке документов исследования; 2) по реализации документов; 3) по обеспечению надежности процедуры.
Центральным элементом контент-анализа является логическая модель предмета анализа, в которой выделяются три элемента.
1. Категориальная модель предмета анализа, которая включает параметры и категории анализа, отражающие признаки объекта исследования и их различные аспекты. Каждому признаку соответствует свой параметр исследования, а значению признака - своя категория анализа. При этом каждый параметр анализа может быть представлен в виде системы категорий анализа.
Разработка категориальной модели начинается с определения параметров анализа. Параметры анализа могут быть одномерными и многомерными. Так, параметр «тип автора данного материала» является одномерным параметром, если он характеризуется категорией «журналисты», и становится многомерным параметром, если мы вводим еще какой-либо признак (например, пол автора). Параметры подразделяются также на исчерпывающие (полностью измеряют все аспекты соответствующих признаков) и неисчерпывающие (измеряют лишь некоторые аспекты признака) и т.д.
Вот пример расклада «структуры жизненных ситуаций противостоящих социальных субъектов» на совокупность показателей, с помощью которых определялась как разница между официальными и альтернативными СМИ, так и существенные различия внутри этих групп: оценка ситуации (+, -, +/-, 0), цель деятельности (сохранить ситуацию полностью, изменить ситуацию частично, изменить ситуацию полностью), средство достижения цели (давление сверху, диалог, компромисс, другие средства, давление снизу), модальность действий (возможность, необходимость), политическая позиция (консервативная, либеральная, демократическая), конструктивность отношения к сопернику (сотрудничество, диалог, конфронтация), результат оценки своих действий (положительный, сбалансированный или нулевой, отрицательный). 10
После установления всех параметров, каждый из них расчленяется на категории анализа, к которым предъявляется ряд требований: они должны отражать цель исследования, быть исчерпывающими,
взаимоисключающими, независимыми, выводиться из одного принципа классификации. По степени соответствия выделенных категорий исследуемой социальной реальности определяется обоснованность методики контент-анализа. Если выбор категорий и единиц анализа
то методика проводимого контент-анализа считается объективной.
2. Система единиц анализа , которая призвана зафиксировать интенсивность проявления того или иного признака и его значения. Данные смысловые единицы фиксируют фрагменты содержания документов. Если расхождение результатов кодировки разными кодировщиками (одних и тех же документов и по одной и той же инструкции) не превышает пяти процентов, то методика проводимого контент-анализа считается надежной.
Выделение смысловых единиц анализа осуществляется на основе сформулированных гипотез. Основными требованиями к подбору единиц анализа являются: единица анализа должна быть достаточно большой, чтобы выражать определенное смысловое значение; одновременно она должна быть достаточно малой, чтобы не выражать слишком много значений; в результате единица анализа должна легко и свободно идентифицироваться; при этом число единиц анализа должно быть таким, чтобы из него можно было сделать выборку.
В качестве единиц анализа могут использоваться: понятие (знак, термин и т.д.), сообщение, тема, суждение, ситуация, действие и т.д. Наименьшей единицей анализа является слово или символ.
Сообщение - одна из наиболее часто используемых единиц анализа. Оно характеризуется целостностью. Наиболее часто используется при анализе небольших текстов.
Тема - это такая единица анализа, которая представляет собой отдельное высказывание об отдельном предмете. Она очень широко применяется в социологических исследованиях. Тема может быть выражена суждением, словом и словосочетанием (наименование рубрики в газете и т.п.).
Суждение является наиболее мощной и одновременно наиболее сложной (для использования) единицей анализа.
Ситуация - это такая единица анализа, которая представляет содержание текста в виде структуры, отражающей фрагменты действительности.
Все единицы анализа классифицируются по трем основаниям:
- языковые и тематические единицы: языковые единицы (элементы структуры языка) редко используются в социологическом исследовании; тематические единицы (элементы структуры содержания текста) находят широкое применение в контент-анализе (тема сообщения, ситуация и т.д.);
- объектные и необъектные единицы анализа: объектные единицы в тексте представлены непосредственно (сообщение, рубрика, слово, предложение - единицы протяженности); к необъектным единицам относятся все тематические единицы;
- коммуникационные и структурные единицы.
3. Меры (единицы ) измерения, фиксирующие регулярность появления смысловых единиц в документе. Определив единицу анализа, надо решить, что при этом следует подсчитывать. Это может быть время, место, частота и т.д. Следует помнить, что любой текст обладает такими признаками, как протяженность и дискретность, поэтому в контент-анализе используется два типа количественных мер (единиц измерения) - единицы протяженности (объем текста в квадратных сантиметрах, объем передачи в минутах эфирного времени и т.д.) и единицы частоты (единичное присутствие какого-либо элемента содержания текста).
Единицы протяженности характеризуют анализируемое содержание в целом, без учета деления этого содержания на элементы. В качестве единиц измерения здесь чаще всего используются: квадратный сантиметр (дюйм), стандартные строки верстки, минута (час) эфирного времени. Единица частоты, в отличие от меры протяженности (которая может быть представлена большим количеством единиц измерения), представляется всего лишь одной единицей измерения - единичным присутствием элемента содержания. Выделение большего количества единиц измерения считается нестрогим или эклектичным, так как единицы протяженности и частоты составляют весь необходимый арсенал измерения содержания по его протяженности и дискретности.
Так, Б.Н. Миронов, разбирая ошибки одного из анализов содержания исторических документов российской истории, пишет: «Но самый большой просчет автора программы заключался в том, что он взялся анализировать всего 46 небольших текстов с помощью контент-анализа, тогда как в данном случае для решения поставленной задачи более подходящим является традиционный монографический подход к каждому указу и манифесту. Крестьянская война представляла собой событие неординарное, исключительное, к тому же продолжавшееся всего около двух лет. Это время было наполнено множеством событий, в которых участвовали - не по шаблону, не по трафарету ~ сотни тысяч людей. Естественно, каждый указ и манифест являлся уникальным - или во всяком случае не типичным, не массовым документом, - отражая накал социальной борьбы, состояние дел в повстанческом и правительственном лагерях, настроение, мнения, потребности, осознание происходящего в рядах восставших в данный момент, в данную историческую секунду. Поэтому классический интенсивный анализ указов и манифестов, направленный на то, чтобы до конца проникнуть в суть документа, исчерпать его содержание, для которого важно каждое слово и даже буква, каждый поворот мысли и аргументации, словом, каждый элемент документа, более уместен в данном случае. Контентный же анализ как анализ экстенсивный, обобщающий успешнее всего работает с источником массовым, отличительные признаки которого - массовость; способность отражать массовые явления исторической действительности; ординарность
обстоятельств происхождения; однородность, повторяемость содержания; однотипность формы, тяготеющей к стандарту. Именно в массовой исторической документации частота повторения смысловой единицы, категорий анализа имеет тенденцию отражать ее значимость. В повествовательном источнике связь между частотой и значимостью нередко нарушается, а может и вообще не наблюдаться, поэтому развернутость, пространство, занимаемое смысловой единицей, более соответствует ее важности, чем частота». 11
При проведении контент-анализа используются такие исследовательские инструменты, как классификатор, протокол, кодировальная матрица, инструкция, список проанализированных документов.
Классификатором контент-анализа является общая таблица, в которую сведены все категории анализа и единицы счета. Основное предназначение подобного классификатора - четко зафиксировать, в каких единицах дана каждая категория. Классификатор можно также использовать в социологической анкете (категории анализа играют роль вопросов, а единицы анализа играют роль ответов). Классификатор является основным методическим документом.
Бланк (протокол ) контент-анализа включает в себя различные сведения о документе (автор, объем, время издания и т.д.). Кроме этого, протокол контент-анализа содержит итоги проведенного анализа. Протоколы обычно заполняются в закодированном виде для сжатия информации.
Инструкция кодировщика содержит описание единиц анализа и мер измерения, а также описание подсчета выделяемых характеристик.
Регистрационная карточка (кодировальная матрица) служит для учета количества единиц счета. Она содержит все классификационные единицы анализа - параметры и категории, обозначаемые обычно определенным кодом. При этом каждый вертикальный столбец в карточке означает отдельный документ (присвоенный ему номер), а каждая горизонтальная строка означает классификационные единицы и меры измерения, выраженные в определенных кодах.
Существуют специальные процедуры подсчета, которые приспособлены именно для нужд контент-анализа. Так, формула Яниса призвана исчислять соотношение между благоприятными и неблагоприятными суждениями, оценками, аргументами. 1 Применяется также построение шкал для оценки выделенных характеристик текста. Подсчет в контент-анализе аналогичен стандартным приемам классификации по выделенным группировкам, ранжирования и шкального изменения. «Например, изучая тематику газеты, мы произведем процентовку по сгруппированным смысловым единицам разного содержания. Можно предпринять перекрестную классификацию (содержание выдвигаемых идей, средства, предложенные для их осуществления, аргументы». 14
На заключительных этапах исследования методом контент-анализа осуществляется содержательная интерпретация результатов декомпозиции текста и квантификации выделенных элементов. При этом используются возможности и преимущества герменевтического и иных подходов. Выявляется, что хотел автор(ы) текста скрыть, подчеркнуть и т.д. Делаются определенные аналитические выводы (на основе некоторых концептуальных построений глубинной психологии и т.д.). При этом выводы и постулируемые положения, естественно, должны быть нацелены на решение поставленных в данном исследовании задач.
Квалифицированно проводимое исследование предполагает применение процедуры верификации полученных исследовательских результатов. Эта процедура совершается, как правило, путем соотнесения и сопоставления новых данных с теми, которые были получены ранее другими исследователями. Часто также используется метод повторения данной исследовательской процедуры (но уже другой группой исследователей). Если же полученная информация хорошо коррелирует с данными, которые были произведены в рамках других исследовательских процедур, то верификация полученных результатов считается вполне успешной.
1. Типы информационных массивов и единицы контент-анализа
Основа контент-анализа - это подсчет встречаемости некоторых компонентов в анализируемом информационном массиве, дополняемый выявлением статистических взаимосвязей и анализом структурных связей между ними, а также снабжением их теми или иными иными количественными или качественными характеристиками. Отсюда понятно, что главная предпосылка контент-анализа - это выяснение того, что считать; иными словами, определение единиц анализа.
Единицы эти в зависимости от целей анализа, типа информационного массива, а также ряда дополнительных причин могут быть (и реально бывают) весьма разнообразными. К ним предъявляются два естественных, но, к сожалению, обычно плохо совместимых требования. С одной стороны, они должны легко и по возможности однозначно идентифицироваться в тексте; в идеале хотелось бы, чтобы их выявление вообще могло быть алгоритмизовано.
Понятно, что такому требованию лучше всего удовлетворяют формальные элементы текста или же элементы, имеющие четко выраженные и однозначные формальные соответствия, например слова. С другой стороны, от единиц контент-анализа чаще всего требуется некая субъективная, да к тому же еще и зависящая от контекста значимость, делающая их распределение и динамику такого распределения диагностичными для выявления изменений в индивидуальном и общественном сознании, системах убеждений и т.д. - иными словами, единицы должны быть интересными для последующей (политологической, культурологической, социологической и т.д.) интерпретации.
Между тем такие единицы (например, темы) носят собственно содержательный характер, и упоминание их в тексте может осуществляться многими разнообразными способами. Их идентификация в общем случае предполагает семантический анализ текста, проблема автоматизации которого, несмотря на многолетние усилия лингвистов и программистов, далека от решения. Характеристику единиц контент-анализа необходимо предварить кратким соображением о природе анализируемого информационного массива.
В самом определении метода контент-анализа нет ничего, что препятствовало бы применению его к отдельно взятому тексту; более того, примеры такого анализа известны. Тем не менее существует ряд причин, по которым объектом контент-аналитических проектов обычно является не отдельный текст, пусть даже значительный по объему, а именно информационный массив, или информационный поток, состоящий из большого количества текстов.
Во-первых, статистические закономерности проявляются тем более отчетливо, чем больше объем выборки.
Во-вторых, большинство целей контент-анализа предопределяют его тяготение к компаративности; аналитиков чаще всего интересуют не одномоментные срезы, а динамика изменений, а если и срезы, то, как правило, «пестрые», отражающие, например, различные СМИ или сознание различных социальных групп.
Наконец, при всем разбираемом ниже разнообразии единиц контент-анализа наиболее популярными являются различные макроединицы: темы и/или проблемы, пропозиции, образы и идеологемы. Таковых в отдельно взятых текстах и особенно в небольших по объему текстах СМИ обычно немного, да и новые макроединицы появляются не столь часто, поэтому оценить их динамику можно лишь на большом временном промежутке или при широком «горизонтальном сопоставлении».
Таким образом, идея контент-анализа предполагает анализ больших информационных массивов; с другой стороны, его относительная дешевизна и технологичность делают такой анализ принципиально возможным. Поэтому не приходится удивляться тому, что в истории контент-анализа имеются такие проекты, как анализ 427 школьных учебников, 481 частной беседы, 4022 рекламных слоганов, 8039 (в 1938) и 19 533 (в 1952) редакционных статей или 15 000 персонажей в 1000 часов телевизионного эфирного времени. Конкретное разнообразие единиц контент-анализа практически безгранично, однако среди них можно выделить несколько основных типов. (Классификация, приводимая ниже, построена с учетом типологии К.Криппендорфа, однако отличается от нее весьма существенно.)
Информационные технологии, способствующие повышению мотивации при обучении говорению.
Использование фразеологических единиц в языке детективного жанра (на примере творчества Агаты Кристи)
При исследовании фразеологического состава современного английского языка мы считаем необходимым ознакомиться с понятиями идиомы (или фразеологической единицы), представленными в различных лингвистических источниках...
Контент-аналитические исследования текстов и текстовых массивов
Контент-аналитические исследования можно разделить на два больших класса, которые, пользуясь вышеупомянутой «военной метафорой», можно назвать фронтальными и рейдовыми...
Лаборатория информационной безопасности: языковой аспект
Всемирная федерация ученых в августе 2000 г. первой в списке угроз человечеству в XXI веке поставила угрозу информационной безопасности. Почему угрозы в информационной сфере вырвались вперед, обогнав экологию...
Методы статистического анализа текста
Появление такого метода как контент-анализ среди других методов статистического анализа было обусловлено прежде всего тем, что возникла потребность в создании определенного объективного метода анализа текста...
Методы статистического анализа текста
Известно, что методика контент-анализа нашла широкое применение именно в информационную эпоху, переживая второе рождение вместе с развитием Интернета. Однако, стоит помнить, что появился данный метод задолго до создания глобальной сети...
Методы статистического анализа текста
Процедура контент-анализа различается в зависимости от источников информации и особенностей задач их анализа. В общем виде она описывается как набор следующих этапов...
Методы статистического анализа текста
В научной литературе принято выделять следующие основные виды контент-анализа : · Количественный контент-анализ...
Сложное синтаксическое целое
В соответствии с вышеизложенным текст может быть проанализирован по следующей схеме, предложенной профессором Солгаником Г.Я. : 1. Характеристика текста с точки зрения его состава (предложение, строфа или фрагмент) и его композиция. 2...
Как и в начале предыдущего, в данном разделе необходимо дать определения некоторым терминам. Информация - все те сведения, которые уменьшают степень неопределенности нашего знания о каком-либо объекте. А, соответственно...
Современные информационные и коммуникационные технологии и их использование при обучении иностранному языку
Все средства ИКТ, применяемые в системе образования можно разделить на два типа: аппаратные и программные. (Сводную таблицу средств ИКТ см. в Приложении 1). Аппаратные средства: Компьютер - универсальное устройство обработки информации...
Теоретические аспекты морфологии
Аналитический подход к языку (путь от языковых средств к их функциям и значениям) во многом предполагает использование одинаковых исследовательских процедур по отношению к единицам фонологического...
Функционирование неологизмов в сфере информационных технологий
Мы уже определили, что входит в понятие языковых неологизмов. Неологизмы сферы информационных технологий делятся на семантические и лексические...
элементы логич. модели предмета контент-анлиза (см.). Содержание текста может быть измерено при помощи двух типов измерения (мер): единиц протяженности и единицы частоты. Единицы протяженности характеризуют содержание в целом, без учета его деления на элементы. В качестве таких единиц чаще всего используются квадратный сантиметр (дюйм), стандартные строки верстки, минута (час) эфирного времени. Использование таких единиц позволяет достаточно точно определить объем внимания коммуникатора к различн. категориям анализа. В силу своей объектности указанные единицы пригодны для измерения только тех свойств коммуникатора, к-рые непосредственно выражаются в его тексте. Единица частоты позволяет измерять поведение и на уровне содержания текста (в частности, измерять структуру тематич. содержания текста). Если мера протяженности представлена достаточно большим видом единиц измерения, то мера частоты представлена единственной единицей измерения - единичным присутствием элемента содержания. Применительно к тексту приведенные единицы исчерпывают арсенал единиц измерения, поскольку текст и его содержание характеризуются только двумя свойствами, к-рые могут быть измерены: протяженностью и дискретностью структуры этой протяженности. Поэтому выделение большого числа типов единиц измерения (мер) является признаком нестрогости или эклектизма. Все единицы анализа в зависимости от характера их связи с единицами измерения можно разбить на два типа: частотные и частотно-протяженные. К частотным в качестве меры приложима только единица частоты (напр., к ним относятся слово, суждение); к частотно-протяженным - оба типа единиц измерения (напр., сообщение). В том случае, когда возможно использование обоих типов единиц измерения, встает проблема оптимальности выбора, сущность к-рой состоит в том, чтобы ответить на вопрос: "Выражается ли данный признак наиболее адекватно при помощи протяженности или при помощи частоты?". Ответ на такой вопрос не является тривиальным и требует проведения специальных исследований. В принципе можно предположить, что число типов единиц анализа велико. Можно считать, что каждая из единиц содержания текста может быть потенциально единицей анализа. Введение новых единиц анализа определяется соответствующими теоретич. предпосылками. Поскольку запас языковых единиц содержания (как типов) ограничен, то и число единиц анализа, рекрутируемых из этой сферы, невелико. Значительный по объему источник потенциальных единиц анализа представляют тематич. элементы содержания текста. Единицы анализа могут быть классифицированы по следующим трем основаниям: языковые-тематич., объектные-необъектные, коммуникационные-структурные. Как правило, языковые единицы (элементы структуры языка) крайне редко используются в качестве единиц анализа в социологич. исследованиях. Тематич. единицы (элементы структуры содержания текста) в настоящее время занимают все большее место в контент-аналитич. исследованиях (напр., тема сообщения, герой, ситуация). Те единицы анализа, к-рые непосредственно представлены в тексте, являются объектными. К ним относятся единицы протяженности (сообщение, рубрика, слово, предложение). К необъектным единицам относятся все тематич. единицы. Противопоставление коммуникационных единиц структурным связано с онтологическим статусом единиц анализа. Естественно, что все языковые единицы обладают этим статусом (т. е. используются и при создании текста, и при его потреблении). Таким статусом обладают и нек-рые тематич. единицы (напр., тема сообщения). Наиболее часто используются следующие единицы анализа. Слово (словосочетание) - наименьшая единица анализа (из языковых), приемлемая в социологич. исследовании; используется в анализе политич. языка, исследовании стиля сообщений. Сообщение - одна из наиболее часто используемых единиц анализа. Характеризуется целостностью. Размер и структура сообщений зависят от типа коммуникации. Выделение сообщения в структуре текста обычно не требует к.-л. специальных инструкций. Герой (характер) - определенный тип деятеля, обладающего четко выраженными соц. чертами. Наиболее часто эта единица используется при анализе небольших произведений литературы (рассказ, очерк). Примером этой единицы является герой информации, выделяемый в содержании на основе рода его занятий. Тема - очень широко применяемая и очень плохо разработанная единица анализа. В амер. литературе термины "суждение" и "тема" употребляются как синонимы, причем чаще всего тема определяется через понятие суждения. Понятие темы используется в таких случаях в категориальном значении, т. е. говорится скорее о тематич. признаке, чем о единице анализа, ибо темы могут выделяться и в целых сообщениях, и в их частях различн. объема (абзацах, предложениях). Тема может быть выражена не только суждением, но и словом, и словосочетанием (напр., наименование рубрики в газете). Суждение - наиболее мощная и сложная в использовании единица анализа. В качестве его определения может быть принято определение суждения в логике с учетом двух особенностей использования этой единицы в контент-анализе. Во-первых, суждение обладает высокой степенью конструктивности и поэтому, вероятно, не является коммуникационной единицей. Во-вторых, структура суждения как единицы анализа обычно является более расчлененной и сложной, чем в логике. Чаще всего она состоит более чем из трех элементов (субъекта, предиката и связки). В общем виде структура суждения может быть представлена в фасетной форме, т. е. в виде ряда ячеек, в к-рых расположены однотипные элементы. Такое представление означает, что при конкретном наполнении такая структура порождает огромное число типов суждений (напр., при шести фасетах и числе элементов в каждом из них от 5 до 10 общее число типов суждений может достигать нескольких миллионов). Практически в исследуемых текстах на один тип суждения в среднем приходится 1-2 упоминания, следовательно, значительное число типов суждений вообще не встречается в содержании текста. Поэтому чаще всего информация анализируется не в виде суждений в целом, а в виде отдельных фасетов, т. е. единицей анализа практически является элемент суждений. При использовании ЭВМ можно выделить эмпирически наиболее значимые в статистич. отношении типы суждений и вести их анализ. Возможно также и такое решение: определить уровень отождествления суждений (напр., на основе их модальности), и различать суждения согласно этому уровню; при этом число типов суждений уменьшается до приемлемой величины (5-10 типов). Суждение является гибкой единицей анализа, может быть использовано для относительно небольших частей содержания текста. Ситуация - это единица, к-рая имеет целью представить содержание текста в виде структуры, отражающей фрагменты действительности. Фрагменты могут быть представлены не только в виде действующего лица, но и в виде мотивов, средств, целей деятельности. В состав структуры ситуации могут входить следующие элементы: субъект деятельности, локальность субъекта (сфера соц. жизни и т. п.), характер представления субъекта коммуникатором, знак отношения коммуникатора к субъекту, интересы субъекта, его цели, мотивы действий и т. п. Близкой по замыслу к ситуации является такая единица анализа, как единица действия, к-рая может быть использована как элемент ситуации. Классич. примером такой единицы является функция действующих лиц волшебных сказок, разработанная В.Я.Проппом. В большинстве контент-аналитич. исследований используется несколько единиц анализа. Это связано с кодировочной операцией в контент-анализе, где необходимо взаимодействие единиц анализа. Указанное взаимодействие может быть рассмотрено в связи с двумя процессами, во многом обеспечивающими получение аналитич. информации (т. е. информации о предмете исследования, получаемой в соответствии с задачами исследования): процессом кодирования и процессом структурирования закодированного материала. В процессе кодирования выделяются два аспекта: разбиение содержания текста на единицы (юнитизация) и их классифицирование по категориям анализа. В рамках разбиения содержания текста выделяются единицы: выборочн., наблюдения, фиксирующая, кодировочная контекста. Эти пять типов единиц представляют наиболее общий случай. В отдельных исследованиях число единиц может быть меньшим. Границы между типами единиц являются достаточно подвижными, т. е. возможен переход конкретных единиц из типа в тип. Выборочн. единица определяет объем исследуемого текста. Чаще для этого используется макросообщение (номер газеты, день вещания или программа вещания). Однако можно представить себе иерархич. структуру выборки, в к-рой в роли единиц последовательно выступают, напр., номер газеты, материал, суждение. Единицей наблюдения, т. е. единицей, в рамках к-рой производится семантич. анализ содержания текста с целью кодирования, обычно является сообщение (напр., статья, очерк и т. а). При иерархич. структуре выборки в роли единицы наблюдения могут выступать и части сообщения. Фиксирующая единица - это та часть содержания текста, в пределах к-рой происходит фиксация категорий анализа. Смысл введения этой единицы определяется спецификой частотного измерения (основанного на использовании единицы частоты). В границах фиксирующей единицы появление категории фиксируется только один раз. Выбор этой единицы сказывается на рез-тах анализа. Поэтому важно определение относительной протяженности единицы фиксирований. Пока часто используется механич. разбиение текста на фиксирующие единицы (напр., 50, 100, 150 строк). Однако следует признать, что механич. разбиение не является обоснованным и очень плохо связано с тематич. структурой содержания. По-видимому, объем указанной единицы должен определяться характером коммуникационного процесса. Кодировочная единица обеспечивает фиксирование категорий анализа и тем самым измерение интенсивности появления признаков объекта исследования. В качестве кодировочных обычно выступают такие единицы, как слово, тема, сообщение, суждение, ситуация, действие. Кодировоч. единица зависит от единицы контекста - части содержания текста, знание к-рой позволяет произвести классифицирование единицы содержания, релевантной принятой кодировочной единице, и соответствующую категорию анализа. Естественной единицей контекста выступает сообщение. (В этом случае может совпадать с единицей наблюдения; однако факт совпадения на означает, что не нужно функциональное разграничение этих типов жизнь ниц. ведь эти единицы выполняют различ. функции) Возможно использование меньших и больших, чем сообщение, единиц контекста (напр., абзаца, страницы). При использовании для измерения единиц протяженности фиксирующая единица сливается с кодировочной. В этом случае процесс кодирования осложняется необходимостью измерения протяженности единиц содержания, релевантных кодировочной единице. Основание классификации связано с выделением единицы анализа, при помощи к-рой производится структурирование закодированного материала, т. е. представление структуры ана-литич. информации. Здесь выделяются единицы классификации и единицы структурирования. В роли первых выступают единицы, используемые в качестве кодировочных. Единицы структурирования - это единицы, в терминах к-рых ведется анализ. Выбор единицы структурирования обосновывается целями исследования и часто существенно влияет на выводы аналитика. Существует еще одна возможность взаимодействия единиц, к-рая связана со стадиями анализа. Поскольку большая по объему единица анализа может быть охарактеризована при помощи меньших, то при использовании в качестве кодировочных наименьших (из приемлемых для проводимого исследования) единиц мы сохраняем возможность использовать закодированный материал для целей интегрирования на уровне единиц анализа. Так, возможен переход от слов и суждений к сообщениям. Конечно, возможность такого перехода определяется категориальной системой предмета исследования (т. к. иногда единицы анализа определенного объема могут быть нерелевантными принятым в исследовании категориям анализа). Наиболее оптимальным является вариант одновременного интегрирования категорий и единиц анализа. Он дает возможность измерения в одном исследовании различн. уровней содержания текста. Лит.: см. к ст. Контент-анализ. Е.Л. Гаршис.