688IT编程网

688IT编程网是一个知识领域值得信赖的科普知识平台

语料库

陕西省旅游景区公示语翻译语料库系统的设计与实现

2024-05-02 11:23:44

陕西省旅游景区公示语翻译语料库系统的设计与实现作者:董,高东怀,朱益平,张知元来源:《中国教育信息化·高教职教》2012年第12期        摘   要:根据语料库语言学的基本观点,结合陕西省旅游景区的文化特及多样性特点,对陕西省旅游景区公示语翻译语料库的主题栏目进行了规划,开发了一套基于PHP的陕西省旅游景区公示语翻译语料库系统。该系统...

数字化生态视域下影视作品文化素材语料库的建设探索

2024-04-18 08:51:43

数字化生态视域下影视作品文化素材语料库的建设探索摘要:信息化时代对外语教学提出了数字转型的新要求。本文依据谢弗的文化理论,探讨影视作品文化素材语料库的素材发掘、框架设计及社会功用等内容,为外语学科的数字化改革做出新尝试,为课程思政提供新资源。关键词:语料库;数字化;影视作品;文化素材2017年麦肯锡公司在其报告中第一次提出 “数字化转型”的概念。这一理念随即被教育领域接受并获得广泛推广。建设高性能...

如何在ChatGPT中添加自定义语料库

2024-04-05 18:31:48

如何在ChatGPT中添加自定义语料库ChatGPT是一个基于大规模预训练模型的对话生成系统,它使用世界各地各个领域的互联网数据进行预训练,以此来生成自然流畅的回复。然而,尽管其预训练数据庞大且多样化,但对于特定领域或个性化需求的对话场景,ChatGPT可能会显示出一些不完全准确或不理想的回复。为了改善这一点,我们可以通过添加自定义语料库来增强ChatGPT的知识和理解能力。本文将介绍如何在Cha...

中日对译语料库使用方法

2024-03-31 16:52:23

中日对译语料库使用方法1.引言概述部分可以对中日对译语料库的使用方法进行简要介绍,包括介绍中日对译语料库的定义、特点和使用场景等。概述部分内容如下:1.1 概述中日对译语料库是一个用于中日互译的语料库资源,它包含了大量的中文和日文文本对照数据。这些数据可以帮助翻译人员准确理解中日两种语言之间的差异,提高翻译品质和效率。中日对译语料库的特点有以下几个方面:首先,中日对译语料库的数据来源广泛,涵盖了各...

语料库 !!!

2024-03-27 06:00:16

如果你也搞语言,你会用到的语料库~~中央研究院现代汉语标记语料库(现代汉语平衡语料库):www.sinica.edu.tw/SinicaCorpus/这是首页。进入中文版,就是这个:www.sinica.edu.tw/ftms-bin/kiwi1/mkiwi.sh中央研究院近代汉语标记语料库:www.sinica.edu.tw/Early_Mandarin...

基于语料库的同义词组辨析r——以adhere to,cling to,hold to为例_百 ...

2024-03-01 01:43:07

基于语料库的同义词组辨析r——以adhere to,cling to,hold to为例赵杭飞【摘 要】作为新的语言研究方法,语料库语言学对于语言研究影响重大,基于语料库的研究也已在多个领域得到广泛应用,然而对同义词组的研究甚少.本文借助美国当代英语语料库(COCA)从词频、语域、搭配以及语义韵四方面比较区分同义词组adhere to,cling to,hold to的用法,旨在帮助英语学习者区分...

语料库常用统计方法

2024-02-22 16:10:38

frequency函数计算频数3.5语料库常用统计方法第3章前几节对语料库应用中的几种主要技术做了介绍。通过语料检索、词表和主题词表的生成,可以得到一定数量的句子、词汇或结构。为能更好说明所得到的结果的真正意义,常常需要对它们加以统计学分析。本章主要介绍语料分析中的一些常用统计方法。3.5.1 语料库与统计方法介绍相关统计方法之前,首先需要了解为什么语料库应用中需要运用统计方法。在2.1节讲到文本...

GENSIM官方文档(4.0.0beta最新版)-面向新手的核心教程

2024-02-04 00:12:56

GENSIM官⽅⽂档(4.0.0beta最新版)-⾯向新⼿的核⼼教程GENSIM官⽅⽂档(4.0.0beta最新版)-⾯向新⼿的核⼼教程译⽂⽬录博主全天在线,欢迎评论或私信讨论NLP相关问题1. 核⼼概念本模块介绍Documents, Corpora, Vectors and Models:他们是理解和使⽤gensim所需的基本概念和术语。import pprintgensim的核⼼概念有:1....

Python自然语言处理中的Gensim技巧

2024-01-29 01:35:52

Python自然语言处理中的Gensim技巧一、前言自然语言处理(Natural Language Processing, NLP),是人工智能(AI)和语言学领域的交叉学科,其目的是让计算机具备识别、理解、生成自然语言文字的能力。Python作为一个快速开发的高级编程语言,已经成为了NLP中最流行的语言之一。Gensim是Python中的一种自然语言处理库,提供了从原始文档中抽取和推断语义信息的...

python机器学习——NLTK及分析文本数据(自然语言处理基础)

2024-01-27 01:42:47

python 机器学习——NLTK 及分析⽂本数据(⾃然语⾔处理基础)NLTKNLTK(Natural Language Toolkit),⾃然语⾔处理⼯具包,在NLP(⾃然语⾔处理)领域中,最常使⽤的⼀个Python库。⾃带语料库,词性分类库。⾃带分类,分词功能。NLTK安装 安装:pip install NLTK测试:import nltkAnaconda不⽤安装安装语料库:执⾏代码后,会出现...

python中文文本里的词的重复数_Python数据挖掘——文本分析

2024-01-27 01:33:54

python中⽂⽂本⾥的词的重复数_Python数据挖掘——⽂本分析python中文文档作者 | zhouyue65来源 | 君泉计量原⽂ | Python数据挖掘——⽂本分析⽂本挖掘:从⼤量⽂本数据中抽取出有价值的知识,并且利⽤这些知识重新组织信息的过程。⼀、语料库(Corpus)语料库是我们要分析的所有⽂档的集合。⼆、中⽂分词2.1 概念:中⽂分词(Chinese Word Segmentat...

AGeneralserviceListofEnglishWords英语通用词表

2024-01-18 03:29:25

A Gener‎a l servi‎c e List of Engli‎s h Words‎英语通用词‎表Micha‎e l West在‎1953年‎发表的经典‎著作 A Gener‎a l servi‎c e List of Engli‎s h Words‎(英语通用词‎表)中的语义频‎率数据加以‎对照分析。后者是一部‎非常独特的‎著作,虽然其中的‎数据是根据‎电脑时代之‎前所建立的‎一个语料库...

python情感分析语料库_python中文情感分析Snownlp库的使用

2024-01-15 18:54:37

python情感分析语料库_python中⽂情感分析Snownlp库的使⽤不⽢⼼的时候,就是在进步;痛苦的时候,就是在成长。⽂章⽬录⼀、Snownlp 简介SnowNLP是⼀个python写的类库,可以⽅便的处理中⽂⽂本内容,是受到了TextBlob的启发⽽写的,由于现在⼤部分的⾃然语⾔处理库基本都是针对英⽂的,于是写了⼀个⽅便处理中⽂的类库,并且和TextBlob不同的是,这⾥没有⽤NLTK,所...

pythontransform方法_我应该如何理解pythonsklearn中的.tran。。。_百...

2024-01-15 05:48:10

pythontransform⽅法_我应该如何理解pythonsklearn中的.tran。。。向量器将语料库(例如⽂本⽂档)转换为向量Vector Space Model。有很多⽅法可以做到这⼀点,⽽结果将取决于所使⽤的技术。⽮量器是必要的,因为模型处理的是数字,⽽不是⽂字。具体来说,CountVectorizer的实现将⽣成⼀个数组,其中包含每个单词的出现次数。在这种特定情况下,CountVe...

语料库和应用翻译——以蚕学馆旧址纪念碑碑文的翻译为例

2024-01-15 05:45:27

上海翻译2013ⅣD.1语料库和应用翻译——以蚕学馆旧址纪念碑碑文的翻译为例黄海军王昌米(浙江理工大学外国语学院,杭州310018)[摘要】语料库所提供的词频、索引、搭配及同义词等信息,可以帮助我们在应用英语翻译过程中更好地对词义进行推敲,准确地理解与表达。本文利用美国当代英语语料库(CO C A)的新界面w or dandphr ase.i nf o,对蚕学馆旧址纪念碑碑文翻译的文本语类特征以及...

高校英文网站专用英语语料库构建方案

2024-01-08 01:20:28

高校英文网站专用英语语料库构建方案作者:姚爽 冯春园来源:《现代交际》2017年第05期        摘要:国内外翻译领域越来越多地应用以Trados为代表的辅助翻译软件和语料库技术手段,而大多数国内学者尚未将语料库应用于高校英文网站的开发和建设,此方面研究成果数量不多。本文将语料库引入高校英文网站建设,从语料收集及分类整理、语料描述、  &nb...

《计算机辅助翻译》课程教学大纲

2024-01-07 21:26:36

《计算机辅助翻译》课程教学大纲Computer-assisted Translation适用专业:翻译课程学时:16课程学分:0.5一、课程性质与教学目标本课程是翻译专业高年级的一门选修课程。计算机辅助翻译课开设的前提是学生已具备较好的英汉双语语言技能,掌握了一定的英汉互译理论与技巧,并且有较好的计算机操作能力。该课程旨在向学生介绍计算机辅助翻译的基础知识,让他们熟悉几种常见的CAT软件,如Wor...

nltk数据集格式

2023-12-31 19:34:28

nltk数据集格式    NLTK(Natural Language Toolkit)是一个用于自然语言处理的Python库,它提供了丰富的语言数据集和预训练模型。NLTK数据集通常以特定的格式存储,以下是几种常见的格式:    1. 文本格式(Plain Text),NLTK的一些数据集以纯文本格式存储,每个文本文件对应一个数据实例。这种格式适用于文本分类...

语料库在英语教学中的应用

2023-12-30 17:54:18

语料库在英语教学中的应用作者:刘琳莉来源:《神州》2012年第11期        摘要:利用语料库的方法进行英语教学是语言教学研究领域中一门新兴的学科,在教学中可以为学生提供真实的语言材料并达到学习英语的目的。本文首先讨论了语料库的定义及发展历史,分析了英语语料库的作用及语料库对英语教学的影响,最后也阐述了英语语料库在独立院校英语教学中的应用。 ...

一个超大规模分类标注语料库的建立

2023-12-30 16:37:17

一个超大规模分类标注语料库的建立刘华摘要:针对文本分类中训练(测试)集获得较难、分类系统不合理的问题,我们构建了一个超大规模层级网页分类语料库。该语料库字段信息丰富,分类系统科学,存储格式可扩展性强、语义结构化。适合构建文本分类、话题识别和信息检索的大型训练(测试)集。关键词:语料库内容解析字段信息分类体系  xmlConstruction of a Super Classed and...

DynamicTopicModels的Python实现

2023-12-23 05:28:16

DynamicTopicModels的Python实现Dynamic Topic Models的Python实现Dynamic Topic Models(DTM)简介Dynamic Topic Models来源于Blei于2006发表在第23届机器学习国际会议上的论⽂ ,与先前的Latent Dirichlate Allocation(LDA)模型有所不同,DTM引⼊了时间因素,从⽽刻画语料库主题...

中文文本校对源码java_浅谈中文文本自动纠错在影视剧搜索中应用与Java实...

2023-12-22 21:38:51

中⽂⽂本校对源码java_浅谈中⽂⽂本⾃动纠错在影视剧搜索中应⽤与Java实现1.背景:这周由于项⽬需要对搜索框中输⼊的错误影⽚名进⾏校正处理,以提升搜索命中率和⽤户体验,研究了⼀下中⽂⽂本⾃动纠错(专业点讲是校对,proofread),并初步实现了该功能,特此记录。2.简介:中⽂输⼊错误的校对与更正是指在输⼊不常见或者错误⽂字时系统提⽰⽂字有误,最简单的例⼦就是在word⾥打字时会有红⾊下划线提...

基于Web的多媒体新闻语料库的建设与实施_以听力教学与研究为目的的设计...

2023-12-19 11:47:11

第22卷现代教育技术V ol. 22 2012年第8期Modern Educational Technology                                  No.8 2012基于Web的多媒体新闻语料库的建...

中国海关总署网站对外传播现状与建议——基于语料库的英语新闻翻译研究...

2023-12-19 11:09:16

中国海关总署网站对外传播现状与建议——基于语料库的英语新闻翻译研究胡妤郑继正***基金项目:本文为教育部人文社科研究一般项目“英汉关务词典编纂与研究”(项目号:19YJA740087)、上海海关学院科研启动项目"社会学视域下对外传播英译规范研 究”(项目号:2314079Q18)的阶段性成果。*作者简介:胡妤,上海海关学院海关外语系讲师、博士;郑继正,上海海关学院海关外语系副教授、博士。摘 要:海...

中文平行语料库

2023-12-16 16:50:01

中文平行语料库机器翻译需要的平行语料库一库难求,笔者列举了一些免费的中文数据集,可用于中文和其他语言之间的机器翻译。1.汉英10000平行语料库    www.datatang/data/1477910000句对规模的英汉双语句对齐语料库,已经做了分词和句子对齐。2.汉英22万句对法律类句子对齐语料    www.data...

AntConc详细使用手册

2023-12-10 18:39:57

AntConc详细使用手册AntConc是一款非常实用的软件,用于分析语料库中的词汇和语法模式。以下是AntConc的详细使用手册:1、安装和启动首先,您需要从Anaconda下载并安装Anaconda。这是一个Python发行版,其中包括了AntConc所需的许多库和工具。安装完成后,打开Anaconda Navigator并点击“Launch”按钮启动Jupyter Notebook。在J...

英语词汇学的研究方法

2023-12-07 10:20:23

英语词汇学的研究方法英语词汇学是一门探讨英语词汇起源、发展、构成以及应用的学科。对于英语学习者来说,掌握词汇学的研究方法有助于加深对英语词汇的理解,提高词汇使用的准确性。本文将介绍英语词汇学的研究方法,包括基于文本的语言分析、基于语料库的语言研究和基于神经科学的语言学习等。一、基于文本的语言分析基于文本的语言分析是一种通过对大量文本数据进行统计分析,探讨词汇在英语语言中的使用规律和特征的研究方法。...

python自然语言处理实战_Python自然语言处理PDF清晰完整版

2023-12-03 10:23:32

python⾃然语⾔处理实战_Python⾃然语⾔处理PDF清晰完整版推荐Python⾃然语⾔处理⽅⾯的权威之作 ,快速了解⼀些概念及基本⼯作原理的必读,提供丰富英⽂语料库和代码,⽅便练习 。名⼈推荐“少有的⼀本书,⽤如此清晰的⽅法如此优美整洁的代码处理⼀个如此复杂的计算机问题……这是⼀本从中可以学习⾃然语⾔处理的书。”——Ken Getz, MCW Technologies⾼级顾问⽬录第1章 语...

英语音乐专有名词语料库

2023-12-01 02:38:27

英语音乐专有名词语料库1、vibration振动2、tone音(乐音)3、musical tone乐音4、acoustics声学5、psychoacoustics心理声学6、frequency频率7、wave form波形8、pitch音高9、loudness响度10、duration时值11、timbre音(tone color or quality)12、tuning fork音叉13、pu...

python编写程序输出诗句_闲来无事能干嘛用Python来玩诗歌接龙

2023-11-29 14:07:52

python编写程序输出诗句_闲来⽆事能⼲嘛⽤Python来玩诗歌接龙闲来⽆事能⼲嘛 ⽤Python来玩诗歌接龙作为⼀个懂Python爬⾍的运维狗,闲来⽆事的时候总要点乐⼦(睡觉不⾹么),哈哈,就是这么的敬业(其实是⽆聊)。今天⽹盾科技给⼤家讲讲怎么⽤Python爬⾍来实现诗歌接龙,做好了⼀起来玩鸭!该项⽬的思路如下:利⽤爬⾍爬取诗歌,制作诗歌语料库,然后将诗歌分句,形成字典:键(key)为该句...

最新文章