内容分析是以定量或定性的方式对文本内容(如谁对谁说了什么,为什么这么说,有什么效果,效果的程度如何等)进行的系统性分析。内容分析一般按如下步骤开展。首先,当要分析的文本很多时(如新闻故事、财务报告、博客、在线评论等),研究者需要从总体样本的文本中抽取一部分文本进行分析。这个过程并不是随机的,那些含有丰富内容的文本被选择性地选取。其次,研究者应确定并应用某种规则将文本分割为可作为独立分析单元的部分或“块”。这个过程称之为单元化。例如,每个单元可能由文本中的假设、效果、推动因素与阻碍因素而构成。再次,研究者构建并应用在每个单元化的文本部分中的一个或多个概念的过程被称作编码。为了满足编码的目的,在对文本进行归类时,研究者需要采用一种基于其正在寻求或揭示的主题的编码方案。最后,对编码数据进行定量和定性分析以决定哪些主题出现频率最多,在何种情境出现以及这些主题间是如何相互关联的。
一种简单的内容分析类型是情感分析,它是一种用于刻画人对一个对象、人或现象的观点或态度的技术。这种分析的一个例子是,阅读一个在线论坛上关于某位政治候选人信息,并将每条信息分作正向的、负向的或中立的。在这个例子中,每条信息代表了一个分析单元。这种分析有助于确认样本整体是否对候选人持正向、负向或中立的态度。用同样的方式对在线评论的内容进行分析是另外一个例子。尽管这种分析可以手动完成,当数据集非常庞大时(上百万的文本记录),基于自然语言处理和文本分析的软件程序可用于自动编码过程,并可以保持人们随时间的情感波动记录。
对于内容分析的常见的一种批评是其缺乏让其他研究者复制该分析的一系列系统性的程序。针对这一批评,席林(2006) 1 提出了综合不同内容分析步骤的螺旋模型。该模型由文本描述的五个水平或阶段组成:(1)将录音转换成可供内容分析的原始文本数据或脚本,(2)将原始数据转换成压缩协议,(3)将压缩协议转换成初步的类别系统,(4)利用初步类别系统形成编码协议,(5)分析编码协议,形成对研究形象的表述。
内容分析有几点缺陷。第一,编码过程受制于文本形式的信息。例如,如果研究者有兴趣研究人们对死刑的看法,但不存在与之相关的文档,那么该分析无法进行。第二,采样是必须非常认真以防止采样偏差。例如,如果你采用的样本总体是关于某一话题的发表的研究文献,那么你已经系统性地忽略了那些未发表的研究或者那些最近的即将发表的文献。
- 瀏覽次數:6492