注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件工程及軟件方法學(xué)自然語言標(biāo)注:用于機(jī)器學(xué)習(xí)(影印版)

自然語言標(biāo)注:用于機(jī)器學(xué)習(xí)(影印版)

自然語言標(biāo)注:用于機(jī)器學(xué)習(xí)(影印版)

定 價(jià):¥54.00

作 者: (美)普斯特若夫斯基,(美)斯塔布斯 著
出版社: 東南大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

ISBN: 9787564142810 出版時(shí)間: 2013-06-01 包裝: 平裝
開本: 16開 頁數(shù): 324 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  是時(shí)候創(chuàng)建屬于你自己的用于機(jī)器學(xué)習(xí)的自然語言訓(xùn)練語料庫了。無論你使用英語、漢語或者其他任何一種自然語言,《自然語言標(biāo)注:用于機(jī)器學(xué)習(xí)(影印版)》都可以手把手地指導(dǎo)你一種經(jīng)驗(yàn)證的標(biāo)注開發(fā)周期一一把元語添加到你的訓(xùn)練語料庫中來幫助機(jī)器學(xué)習(xí)算法更有效工作的過程。你無需任何編程或者語言學(xué)方面的經(jīng)驗(yàn)就可以上手。通過每一步中的詳細(xì)示例,你將學(xué)到“標(biāo)注開發(fā)過程”是如何幫助你建模、標(biāo)注、訓(xùn)練、測(cè)試、評(píng)估和修正你的訓(xùn)練語料庫。你也將了解到一個(gè)實(shí)際標(biāo)注項(xiàng)目的完整演示。

作者簡(jiǎn)介

  Jarues Plastejovsky,是Brandeis大學(xué)的教授,他在該大學(xué)的計(jì)算機(jī)科學(xué)系講解和研究人工智能及計(jì)算語言學(xué)。Amber Stubbs,剛剛獲得了Brandeis大學(xué)標(biāo)注方法論的博士學(xué)位。她現(xiàn)在是SUNY Albany大學(xué)的博上后。

圖書目錄

Preface
1. The Basics
The Importance of Language Annotation
The Layers of Linguistic Description
What Is Natural Language Processing?
A Brief History of Corpus Linguistics
What Is a Corpus?
Early Use of Corpora
Corpora Today
Kinds of Annotation
Language Data and Machine Learning
Classification
Clustering
Structured Pattern Induction
The Annotation Development Cycle
Model the Phenomenon
Annotate with the Specification
Train and Test the Algorithms over the Corpus
Evaluate the Results
Revise the Model and Algorithms
Summary
2. Defining Your Goal and Dataset
Defining Your Goal
The Statement of Purpose
Refining Your Goal: Informativity Versus Correctness
Background Research
Language Resources
Organizations and Conferences
NLP Challenges
Assembling Your Dataset
The Ideal Corpus: Representative and Balanced
Collecting Data from the Internet
Eliciting Data from People
The Size of Your Corpus
Existing Corpora
Distributions Within Corpora
Summary
3. Corpus Analytics
Basic Probability for Corpus Analytics
Joint Probability Distributions
Bayes Rule
Counting Occurrences
Zipf's Law
N-grams
Language Models
Summary
4. Building Your Model and Specificationl
Some Example Models and Specs
Film Genre Classification
Adding Named Entities
Semantic Roles
Adopting (or Not Adopting) Existing Models
Creating Your Own Model and Specification: Generality Versus Specificity
Using Existing Models and Specifications
Using Models Without Specifications
Different Kinds of Standards
ISO Standards
Community-Driven Standards
Other Standards Affecting Annotation
Summary
5. Applying and Adopting Annotation Standards
Metadata Annotation: Document Classification
Unique Labels: Movie Reviews
Multiple Labels: Film Genres
Text Extent Annotation: Named Entities
Inline Annotation
……
6. Annotation and Adjudication..
7. Training: Machine Learning...
8. Testing and Evaluation.
9. Revising and Reporting.
10. Annotation: TimeML.
11. Automatic Annotation: Generating TimeML.
12. Afterword: The Future of Annotation.
A. List of Available Corpora and Specifications
B. List of Software Resources
C. MAE UserGuide
D. MAI UserGuide
E. Bibliography
Index

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)