毛片免费视频肛交颜射免费视频,免费看成人A片无码照片,chinese国产xxxx实拍,少妇高潮喷水久久久影院

語(yǔ)料工具

Corpus Tools
ABBYY FineReader

ABBYY FineReader

ABBYY FineReader是一款OCR軟件,可以進(jìn)行文件識(shí)別、自動(dòng)保留排版格式,后臺(tái)批處理識(shí)別等功能。用戶可以利用ABBYY FineReader進(jìn)行對(duì)不可編輯文本的掃描,如圖像、PDF等格式的語(yǔ)料,以獲取Microsoft Word等格式的可編輯的文檔。
天若OCR文字識(shí)別

天若OCR文字識(shí)別

天若OCR文字識(shí)別是一款界面簡(jiǎn)潔、功能強(qiáng)大的OCR識(shí)別軟件,可將圖片中的文本轉(zhuǎn)換成可編輯文本,將表格識(shí)別后轉(zhuǎn)換成可編輯表格,進(jìn)行識(shí)別翻譯、截圖及截圖標(biāo)注等,處理圖像或PDF等格式語(yǔ)料極為方便。
AntConc

AntConc

AntConc是一款免費(fèi)的單語(yǔ)語(yǔ)料檢索工具,支持Windows, MacOS等系統(tǒng),具有索引、索引定位、詞叢、搭配、詞表和關(guān)鍵詞單等多種功能,界面簡(jiǎn)單,方便用戶操作,可以極大提高語(yǔ)料檢索的效率。
TextForever

TextForever

TextForever可以用來(lái)進(jìn)行文本HTML到TXT的轉(zhuǎn)換、文件切分、文檔合并、文本提取、TXT文件分行、HTML代碼整理等功能。在使用Teleport Ultra軟件提取網(wǎng)頁(yè)中的語(yǔ)料后,我們可以使用TextForever軟件對(duì)所獲取的語(yǔ)料進(jìn)行格式處理,搜集所需格式的語(yǔ)料,兩個(gè)軟件的搭配使用使得語(yǔ)料搜集過(guò)程更加方便快捷。
Microsoft Word

Microsoft Word

微軟Word是微軟公司開(kāi)發(fā)的一款文字處理軟件。相信大家日常辦公都會(huì)或多或少用到它,其實(shí)它還有許多隱藏技能,今天為大家介紹其中之一——語(yǔ)料清洗。

具體來(lái)說(shuō),利用Ctrl+H快捷鍵調(diào)出查找與替換對(duì)話框,點(diǎn)擊“更多”,單擊勾選“通配符”,借助通配符快速清洗語(yǔ)料。

EmEditor

EmEditor

EmEditor是一個(gè)輕量級(jí)、可擴(kuò)展、易于使用的Windows文本編輯器,適用于Windows系統(tǒng)。EmEditor在64位和32位版本中都可用。我們可以在EmEditor軟件中利用正則表達(dá)式快速清洗語(yǔ)料,具體操作是導(dǎo)入文本后,點(diǎn)擊“搜索”,單擊“替換”,再勾選“正則表達(dá)式”,利用正則表達(dá)式清洗語(yǔ)料。

正則表達(dá)式學(xué)習(xí)參考:

https://www.runoob.com/regexp/regexp-tutorial.html

在線正則表達(dá)式測(cè)試平臺(tái):

https://tool.oschina.net/regex

Notepad++

Notepad++

Notepad++是一款與EmEditor類(lèi)似的軟件,Notepad++是Windows操作系統(tǒng)下的一套免費(fèi)的文本編輯器,有完整的中文化接口及支持多國(guó)語(yǔ)言編寫(xiě)的功能(UTF8技術(shù))。同樣,我們也可以借助它,并利用正則表達(dá)式清洗語(yǔ)料,操作與EmEditor類(lèi)似。
斑斕科技小助手

斑斕科技小助手

斑斕科技小助手是一款基于VBA的Word小工具,與庫(kù)酷和文檔整理器不同的是,它可以直接在Word中使用,功能豐富,提供各種快捷鍵,操作簡(jiǎn)單方便,為語(yǔ)料處理提供極大的幫助。
ABBYY Aligner

ABBYY Aligner

ABBYY Aligner 2.0是一個(gè)工具對(duì)齊并行文本和創(chuàng)建翻譯記憶數(shù)據(jù)庫(kù),提供了編輯對(duì)齊結(jié)果的功能,并可以保存為T(mén)MX格式,以便在CAT工具中進(jìn)一步使用,可以提高工作效率。
Tmxmall

Tmxmall

Tmxmall是一款在線語(yǔ)料對(duì)齊工具,語(yǔ)料對(duì)齊方便用戶調(diào)整對(duì)齊結(jié)果,其自主研發(fā)的智能對(duì)齊算法可以自動(dòng)對(duì)齊原文,支持46種語(yǔ)言,2070種語(yǔ)言對(duì),極大提高語(yǔ)料對(duì)齊效率。
ParaConc

ParaConc

ParaConc是一款雙語(yǔ)或多語(yǔ)平行語(yǔ)料庫(kù)建設(shè)與檢索工具,具有語(yǔ)料對(duì)齊、平行文本預(yù)覽功能、平行文本檢索、檢索行排序、詞頻統(tǒng)計(jì)、搭配提取等功能,可以用于語(yǔ)料檢索、對(duì)比分析、語(yǔ)言學(xué)習(xí)和翻譯研究培訓(xùn)等。