(0人评价)
语料库在基础英语教学及研究中的应用
价格 免费

教材语料库:资源重组

试题语料库:分析命题语料库,某一类型题型学生的失分点

音频及视频语料库:视听结合吸收更多的接收信息

学生口笔语语料库:语言能力的实时跟踪

[展开全文]

DocToTxt批量转换格式工具

文本清洁器:批量修改

Tree Tagger 自动词形赋码器

 

[展开全文]

文本信息录入及文本赋码:

1.文本文头信息

2.书面语语料库文头文件

3.Raw Test

4.赋码文本(Tree-Tagger 3.0)

5.生文本及赋码文本比较

6.带文头信息文本 (with metadata)

7.文本录入中的小问题

a.撇号不对

b.标点符号后面的单词与标点符号之间无空格

[展开全文]

一、创建小型教学语料库:

1.教学语料库设计的原则

a.教学针对性原则

b.实用性原则

c.开放性、资源共享原则

2.文本信息录入及文本赋码

3.语料库创建所需软件介绍

二、语料库设计的特点:

1.需要搜集的语料类型和文类

2.语料来源及获取语料的方法

3.入库文本的基本格式及编码

 

[展开全文]

第二部分: N-gram list作用

1. 相关功能:

N-gram list

选中源文件后,点击任务栏上方的N-gram,对word 或其他的长度尽心那个搜索,点击count得出频率

 

[展开全文]

每个词典123级表示不一样含义

[展开全文]

1、N-gram list 词表

    Keyword list 主题词表

2、Tokens:语料库的大小

 

[展开全文]

@look 匹配所有曲折变化形式

sort:排序      sort mode:排序模式

Coll:计算搭配词

Coll Span:搭配跨距

Log-Likelihood:数值越大,搭配强度越大。

 

 

[展开全文]

检索相关功能

1.Concordance 词汇索引

2.Collocation &  Colligation 搭配/类联接

 

#放在词性类别码之前,匹配该词性大类对应的各词性码子类。

 

Batch Search 批量检索

 

[展开全文]

2.1.1 常见学习者词典

Oxford    Longman   Collins

Cambridge  Macmillan

2.1.3 学习型词典特点:收词广泛 与时俱进

2.1.4 语料库与词典

语料库为选词立目提供客观依据

语料库提高词典释义的完美性和准确度

语料库为词典提供真实而具有代表性的例证

语料库为词典更新与修订提供保障

2.2 语料库与教材编写

语料库:教材的语料源泉

语料库:检验教材的手段

语料库:基于词频的教材词汇广度分析

2.3 语料库与大纲制定

Willis(1990)

2.4 词汇大纲与教材编写

尽可能的提高核心词汇覆盖率

严格控制课文长度和生词数量

对提高生词复现率的重视

对常用词语搭配的选择的zhong shi

[展开全文]

1.1 定义

A collection of texts stored in an electronic database.

1.2 类型 5种

通用/专用语料库

笔语/口语语料库

公时/历时语料库

本族语者/学习者语料库(机读学习者语料库)

“中国英语学习者口笔语语料库”

单语/双语/多语yu liao ku

 

 

[展开全文]

Doc ToTxt批量转格式工具

文本整理器 清洁文本

 

[展开全文]

Concordance 词汇索引

Collocation/Colligation 搭配/类联接

词性类别:n名词 v动词 adj形容词 adv副词 pron代词 art冠词 det限定词 conj连词 prep介词 num数词

Case 区分大小写 Batch Search 批量检索(先新建一个文本,将需要检索的词输入进去,然后再导入到软件中)

|(同时检索两个,如is | was)  @(检索同一屈折的词,如@be)  #(检索同一词性类别的词,如#adj)

[展开全文]

文本:可以用记事本打开的 真实的连续的口语或笔语

标注:对文本加以标记  元信息标注:1.文头信息的标注,非语言信息(出版商,年代,作者等) 2.词性标注:文本词性进行标注

形符(token):独立单词   类符(type):独立词形  类形符比(TTR):类符/形符   标准类形符比:STTR  频数:出现的次数  频率:经过标准化计算的次数

搭配(collocation):词语间的关系   类链接(colligation):词语在语法层面的关系

多词序列:词块,n元组  语义韵:积极消极中性

[展开全文]

N-gram 词表

Term(s) 按字母排序

Freq. 按频率排序

Data Type——Lemma 将单词合并为屈折词

Save——保存作用

Length表示词块数

 

生成主题词的语料库

1.observed corpus

2.reference corpus

先打开观察语料库(Row)

Keyness——加载参照语料库——Load Ref. Wordlist

(可通过改变Length数值,比较不同词块)

[展开全文]

授课教师

课程特色

视频(20)
作业(1)
图文(1)