(0人评价)
语料库在基础英语教学及研究中的应用
价格 免费

意义:通过分档作文的主题词看不同档次的作文有什么语言使用特点

使用软件:PowerConc

步骤:1.建立参照语料库的词表和2-3词词块表               (观察2档则3、4、5档为参照)

导入3、4、5档作文,N-gram List Length 1,Save; Length 2, Save; Length 3, Save.

         2.生成各档作文的主题词表和2-3词主题词             块表

导入2档作文,N-gram List Length 1,右下角Keyness, Load Ref. Wordlist导入参照语料库词表,点击Count生成二档作文的主题词表,点击Save

N-gram List Length 2, 同上

       3.观察分析特点

2档作文相对于其它档作文显著使用的词 或词块(简单如常用词,口语化如第二人称you,I think,缩写)(复杂,派生词,表达观点时更复杂)(复杂程度更高,正式,表达丰富,语篇组织词)

[展开全文]

1.主题词指的是一个语料库相对于另一个语料库显著多用的词汇,可以反映语言使用的特点。我们将主题词分析技术应用到分道作文研究中,目的是想通过对比不同档次的作文来考察不同档次的作文各自都有什么样的语言使用特点;

2.涉及两个语料库之间的对比,也就是观察语料库和参照语料库,观察和分析的语料库就叫做观察语料库,用于对比的语料库就叫做参照语料库;

3.power conc软件进行主题词分析时需要两个步骤。第一是需要提前准备好参照语料库的词表或者是词块表。其次第二步才能生成观察语料库的主题词表或者主题词块表;

4.语料库软件统计数据,但是并不能解释数据。在做学术研究中,既要重视对数据的统计和呈现,又要重视对数据的解读。

[展开全文]
  • 研究问题:各档主题词和主题词块使用情况又和差异?
  • 语料来源:高三作文并分档
  • 研究工具:BFSU PowerConc
  • 步骤:分别生成不同词表并保存
  • 剔除与作文内容相关的主题词块并分析结果
  • 2档作文口语化倾向较为严重
  • 3档作文语言表达更为丰富
  • 4档作文词汇更加复杂(派生词等),口语化倾向不明显
  • 5档作文语言语法更加地道
[展开全文]

主题词:一个语料库相对于另一个语料库显著多用的一些人称代词等口语词汇,这些就是主题词,它能在一定程度上反应口语语体的特点

采用主题词分析法考查不同档次的作文各自有什么语言使用特点

一、研究问题
各档作文主题词和主题词块使用情况有何差异?

二、语料来源
某市高三模拟测试作文
题目:义务劳动算学分:太功利还是有必要?
2档至5档作文各随机抽取100篇

2档: 5.5分一 10分 ( 100篇)
3档: 10.5分一 15分 ( 100篇)
4档: 15.5分一 20分 (100篇)
5档: 20.5分一25分 (100 篇)
分档作文语料库(样本)位置:
2017 Corpus\01_ Texts\04_ 作文分析\分档作文RAW

三、研究工具
BFSU PowerConc

四、研究步骤1.建立参照语料库的词表和2-3词词块表2.生成各档作文的主题词表和2-3词主题词块表

五、结果与讨论
各档作文主题词和主题词块使用情况的差异可以从
以下角度分析:
词汇难度、丰富度
口语化倾向
立场词块
语篇词块

思考题
本研究发现的高分作文的语言特征,对英语作文
教学有何启示?

[展开全文]

1.主题词指的是一个语料库相对于另一个语料库显著多用的词汇,可以反映语言使用的特点。我们将主题词分析技术应用到分道作文研究中,目的是想通过对比不同档次的作文来考察不同档次的作文各自都有什么样的语言使用特点;

2.涉及两个语料库之间的对比,也就是观察语料库和参照语料库,观察和分析的语料库就叫做观察语料库,用于对比的语料库就叫做参照语料库;

3.power conc软件进行主题词分析时需要两个步骤。第一是需要提前准备好参照语料库的词表或者是词块表。其次第二步才能生成观察语料库的主题词表或者主题词块表;

4.语料库软件统计数据,但是并不能解释数据。在做学术研究中,既要重视对数据的统计和呈现,又要重视对数据的解读。

 

[展开全文]

分档作文的主题词和主题词块研究——作文的语言使用特点

1. definition-主题词:一个语料库相对于另一个语料库显著多用“人称代词”及“缩合形式” 

2. 研究文题:S各档作文主题词和主题词块使用情况有何差异?

3. 语料来源:

4. 研究工具:BFSU PowerConc(检索工具)

5. 研究步骤:

(1) 建立参照语料库的词表和2-3词词块表(观察语料库和参照语料库)

(2) 生成各档作文的主题词表和词块表

a. 点击参照语料库(示例中采用的是G345)

b. 在powerconc中点击n-gram list生成词表,并“save”保存。根据词长生成不同词长的词表(一词词表,bi-gram list,trigram list)

c. 加载观察语料库(指g-2),点击n-gram list 生成unigram list(data type,word;length,1;count)————> 点击keyness,加载参照词表(load ref.wordlist),count. 并save。依次重复步骤完成bigram 和trigram的keyword的对比表。

?如何提出其中涉及的主题词并且筛出从试卷文本中摘抄的文字。?

总体呈现用词的复杂性,比如多用派生词(词人员汇的不同形式。)

比如正式的用词,如which is of+抽象名词(如importance),coherence,几乎没有人称代词和缩合形式。

?高分作文所展示的文本特征对于教师教学有什么启示?

[展开全文]

分档作文的主题词和主题词块研究

一、研究问题:各档作文主题词和主题词块使用情况有何差异?

二、语料来源

三、研究工具: BFSU PowerConc

四、研究步骤:

1、建立参照语料库的词表和2-3词词块表

2、生成各档作文的主题词表和2-3词主题词块表

五、结果与讨论:

各档作文主题词和注意词块使用情况的差异可以从一下角度分析:

1、词汇难度丰富度

2、口语化倾向

3、立场词块

4、语篇词块

 

 

[展开全文]
  1. 主题词是指在一个语料库中显著多于另一个语料库的词汇,它能够反映出该语料库的语言使用特点。我们将主题词分析技术应用于分道作文研究,旨在对比不同档次作文的语言使用特征,以了解各级别作文的独特之处。

  2. 这项研究涉及两个语料库的对比分析:观察语料库是我们关注的对象,而参照语料库则用于进行对比。

  3. 使用power conc软件进行主题词分析时,可以分为两个步骤。首先,需要准备参照语料库的词表或词块表;其次,才能生成观察语料库的主题词表或主题词块表。

  4. 语料库软件可以统计数据,但无法解释这些数据。在学术研究中,我们需要同时重视数据的统计和呈现,以及对数据的深入解读。

 

 

[展开全文]

1.教学语料库设计的原则

a.教学针对性原则

b.实用性原则

c.开放性、资源共享原则

2.文本信息录入及文本赋码

3.语料库创建所需软件介绍

二、语料库设计的特点:

1.需要搜集的语料类型和文类

2.语料来源及获取语料的方法

3.入库文本的基本格式及编码

[展开全文]

分档作文的主题词和主题词块研究

一、研究问题:各档作文主题词和主题词块使用情况有何差异?

二、语料来源

三、研究工具: BFSU PowerConc

四、研究步骤:

1、建立参照语料库的词表和2-3词词块表

2、生成各档作文的主题词表和2-3词主题词块表

五、结果与讨论:

各档作文主题词和注意词块使用情况的差异可以从一下角度分析:

1、词汇难度丰富度

2、口语化倾向

3、立场词块

4、语篇词块

 

 

 

[展开全文]

课时17

1.主题词指的是一个语料库相对于另一个语料库显著多用的词汇,可以反映语言使用的特点。我们将主题词分析技术应用到分道作文研究中,目的是想通过对比不同档次的作文来考察不同档次的作文各自都有什么样的语言使用特点;

2.涉及两个语料库之间的对比,也就是观察语料库和参照语料库,观察和分析的语料库就叫做观察语料库,用于对比的语料库就叫做参照语料库;

3.power conc软件进行主题词分析时需要两个步骤。第一是需要提前准备好参照语料库的词表或者是词块表。其次第二步才能生成观察语料库的主题词表或者主题词块表;

4.语料库软件统计数据,但是并不能解释数据。在做学术研究中,既要重视对数据的统计和呈现,又要重视对数据的解读。

 

[展开全文]

工具:

DocToTxt批量转格式工具

文本整理器,清洁文本

Tree Tagger 3.0 自动词性赋码器

CLAWS 7 POS 工具

Sub-corpus Creator 子文件夹创建工具

[展开全文]

教材语料库命名:

出版信息,分级,分模块,分单元。

按篇切分,按文体分类,按话题分类。

[展开全文]

doctotext

提前新建文件夹 eg. 01txt

文本整理器(批量处理)

tree-tagger(标注软件)

子文件夹创建工具

非空格 \S+

e.g. >F< 女生作文

 

[展开全文]

创建小学教学语料库的意义

设计原则

1.教学针对性原则(教材试题音频口语) 2. 实用性 3.开放性、资源共享原则

[展开全文]

语料的代表性及平衡问题——阅读文本低于300词的文本不采纳(根据实际情况调整)

 

[展开全文]

创建语料库可用工具:
1.DocToTxt 批量转格式工具
2.文本整理器 清洁文本
3.Tree Tagger 3.0 自动词性赋码器
4.CLAWS 7 POS 工具
5.Sub-corpus Creator 子文件夹创建工具

步骤:先将文件转为txt格式;再处理空格和全角(批量处理是:点击“批量处理”
,添加整理方案 tree-tagger赋码, “open-dir”打开文件夹)

[展开全文]

 

文本信息:

1.文头信息——言语言信息

2.生文本——raw

3.赋码文本——Tree-Tagger

注意比较生文本和赋码文本

 

 

[展开全文]

语料库的设计:语料库建设最重要的环节,直接
影响到语料库的质量和使用。语料库的设计要遵循以下三个原则:
教学针对性原则
实用性原则
开放性、资源共享原则

教学性针对原则有以下几个板块:教材语料库、试题语料库、音频及视频语料库学生口笔语语料库

实用性原则的重点是建立“微型文本”,即按照不同的教学目标,从大型语料库中提取目标
语料制作微型文本,适应课堂教学的要求。
采用自动赋码标软件进行词性和语法标注。

开放性、资源共享原则体现在以下几个方面:1、团队合力参与语料的收集、整理和筛选
2.实现语料的动态更新和即时补充
3.在保证语料质量的前提下尽量扩大库容量,使语料库更具代表性
4.实现资源的开放和共享

 

[展开全文]

一、创建小型教学语料库:

1.教学语料库设计的原则

a.教学针对性原则

b.实用性原则

c.开放性、资源共享原则

2.文本信息录入及文本赋码

3.语料库创建所需软件介绍

二、语料库设计的特点:

1.需要搜集的语料类型和文类

2.语料来源及获取语料的方法

3.入库文本的基本格式及编码

[展开全文]