现代日语书面语均衡语料库(BCCWJ)与日语"言语学"初探

基兰·梅纳德 著(2010年)

指导教授:威廉·克雷奇马博士

佐治亚大学 LING 4080/6080

关键词:计算语言学、日语、NLP、语料库语言学、电子语料库、语义分析

本文为2010年于佐治亚大学(LING 4080/6080)在威廉·克雷奇马博士指导下完成的研究论文,在BCCWJ公开发布前利用其演示版本进行了共现分析研究。

语料库语言学即将受益于一部新型日语书面语电子语料库的公开发布。本研究旨在为将克雷奇马(2009)的"言语学"理论整体性地应用于日语言语数据奠定基础。本文将首先介绍"言叶"项目的概况,阐述理论基础及日语特有的若干问题,继而将辛克莱(2004)的分析方法应用于日语语料库证据,探寻显著搭配关系及言语学的分布规律。

"言叶"项目

计算机处理与存储技术的发展使大规模语言语料库的编纂成为可能,互联网则使其得以向研究者开放。计算机能够分析海量文本,这些分析产生了令人瞩目的研究成果。目前,以英语为对象的语料库研究已相当丰富,日语语料库也已在网络上编纂完成并公开发布。

东京的日本国立国语研究所(NIJL)正在编纂"现代日语书面语均衡语料库"(BCCWJ),预计于2011年向公众开放。据前川(2007)估计,该语料库将包含约1亿词,这些词"从覆盖广泛书面语文本的明确界定的统计总体中随机抽取"(前川 2008)。日本国立国语研究所将"均衡语料库"定义为"尽可能精确地再现现代日语实际面貌"的语料库("国立")。此前的书面日语研究所采用的材料或过于陈旧(例如版权已失效的文学作品),或未进行随机抽样,或在分布上存在偏差。例如,报纸由致力于减少变异的机构制作,而互联网上的文章则缺乏分类,且不包含受版权保护的作品。

BCCWJ将整合三个子语料库:(1)"出版"或"生产"子语料库(3470万词),由"2001至2005年间在日本出版的所有书籍、杂志和报纸统计总体中随机抽取的样本构成"(前川 2008);(2)"图书馆"或"流通"子语料库(3000万词),抽取自"东京都至少13所公共图书馆馆藏的所有书籍"(同上);(3)"专项"或"总体外"子语料库(3500万词),由各约500万词的"各类专项小型语料库"构成,"包括政府白皮书、互联网文本、国会议事录、学校教科书以及过去30年的畅销书文本"(同上)。

本文分析使用的是BCCWJ的在线演示版本,该版本截至2007年9月包含"经著作权清理后可在网上公开获取的1000万词文本的全文检索"(同上)。演示版BCCWJ可为任意检索词提供最多500条检索行。可在节点词前后两侧以自然语言输入附加参数,以精化检索结果。检索行所附分类信息包括作者、作者出生年代、作者性别、体裁、书名/来源、副题/分类、卷号、编者等、出版社及备注。虽然可以将检索行复制到其他程序,但无法在演示版BCCWJ页面上进行统计分析;最终公开发布的语料库将使本文数据得到更为严格的统计处理。

词与语言特征

日语中意义的单位是什么?"词……并非毫无争议地作为语言的基本单位而存在"(辛克莱 2004: 25)——形态素等其他概念也已获得认可,然而形态素对于文本中语言变异的研究而言往往过于微小。在词边界不通过正字法加以区分的日语文本中,何为词?

约翰·辛克莱(2004)为英语结构分析中的复合词汇项目提出了一个模型。在"意义单位探寻"一章中,他为复合词汇项目设立了四个主要结构类别:搭配(共现)、同现句法模式、语义偏好和语义韵。他假设词汇存在一个从"自由选择原则"到"习语原则"的连续体,前者的典型是词"在指称世界时具有固定意义的倾向"(29),即"专门术语倾向";后者的典型是词"相互搭配并通过组合构成意义的倾向"(29),即"语块倾向"。他假定(29-30):

……语言项目的概念可以延伸,至少就英语而言,意义单位预期大体上是短语性的。某些词仍会根据自由选择原则被选用,但可能为数不多,这取决于话语的类型。词自身承载意义的观念将被边缘化,仅在动植物列举等场合中才有语言学意义。

辛克莱曾使用1995年中期的《英语银行》(2.11亿词)来收集短语和词的搭配,以证明词语经常与其他词语相邻出现(搭配),并出现在特定语法模式中(同现句法),分析者还可进一步抽象出"语义偏好"和"语义韵"(2004: 32-3)。即便是像place这样的常见词(正如它可能出现在"……She came over to my place with a friend……"(38)这样的句子中),辛克莱也将其描述为"一个复合词汇项目,具有'非正式邀请'的语义韵,具有'局部移动'的语义偏好,通过与移动动词及可选方向副词的同现句法得以实现,comeover是其典型搭配词"(38)。

语言特征的分布与《言语学》

威廉·A·克雷奇马(小)在《言语学》(2009)中超越了辛克莱的"语块理论",以费迪南·德·索绪尔的研究为基础,将"语言特征"定义为"我们能够识别为与人们所说的话相关的实体或单位的任何事物"(53)。语言特征往往比词更大或更小——词本身就是一个难以定义的概念,但它持续影响着我们对语言的认知(54):

言语的语言特征作为具体实体,通常被理解为:用于同一指称对象的不同词语(同义词),或作为我们所识别的同一词语的组成部分而使用的不同词素或音素,或我们认为具有等价意义或结构的语序的不同排列。对索绪尔而言,"同一性"来自此类识别行为,例如当我们将"messieurs"这个词视为同一个词,即使不同说话者在"语音传递和语调"上存在差异……

约翰·弗斯等人已经证明,词语从语境中派生意义,而非相反。词语在文本中出现的位置与频率——即其分布——极为重要。克雷奇马(2009)所引述的迈克尔·斯塔布斯(2001)对英语的研究使用语料库计算了词形("节点"词)与其搭配词的共现率,发现90%的节点词与其最高频搭配词相邻出现的频率至少为2%,这仍然是偶然共现概率的250倍。因此,克雷奇马(2009)主张"词语在言语中的分布不是随机的,也不是均匀分散的,而是通常以集群形式出现……与其他词语作为搭配词相邻共现"(154),从而"任何给定词语在被视为节点词时,具有多个共现率异常偏高的搭配词,这是语言使用中的……一种正常特征"(154-5)。

克雷奇马(2009)提出了一种新的语言使用研究模型,称为"言语学",作为北美学术界"语言结构语言学"(4)的对应概念,并证明言语和书面语中语言特征的分布是非线性的。当按类型和标记组织并以频率绘图时,语言特征总是呈现出渐近双曲线,即"A形曲线"(197)。这种分布此前被描述为"80/20法则",预测所有类型的20%将占所有标记的80%。元音实现形式、词语、搭配等均遵循这一分布规律,克雷奇马(2010)如此解释(20-1):

……对于此类非线性分布的80/20法则(无论实际比例是90/10还是70/30)告诉我们,在所研究特征的用例中,我们总会发现一种或少数几种构式占了绝大多数,而该特征还会有大量变体构式,只占少数用例……

具有此类分布特征的系统已在其他科学领域被观察到,现在在语言学中也得到了印证;它们被称为"复杂适应系统"。克雷奇马如此解释(2010: 5):

这种或多或少的80/20关系不仅仅是一种奇特现象,而是言语——即我们实际使用的语言——作为复杂系统运作的标志。这种专门意义上的复杂性(而非仅仅意味着"复杂"的通常含义)是许多自然现象的特性,在数学描述上表现为"无切线的曲线",即连续不可微函数——换言之,这种复杂性以A形曲线为特征。

"言语学"模型建立在这种对语言中"涌现秩序"性质的理解之上,为整体性研究言语数据提供了一种新途径。

正字法问题

日语书写系统在日语语言分析中造成了一定的困难。书面日语通常以四种文字体系的组合书写:汉字、平假名、片假名和罗马字。平假名和片假名基本上是以音节为单位的表音文字体系。罗马字是主要用两种相互竞争的系统(赫本式和训令式)对日语进行表音记录的拉丁字母。汉字在语音表现方面则较为复杂。

汉字最初由耶稣会及其他传教士介绍到西方时,被认为代表脱离口语声音的概念,这一错误认识延续至今。汉字通常用于表示日语中大量的汉语借词,但也用于表示许多固有词(包括使用汉日语素在19至20世纪创造的新词)、一些佛教术语(源自梵语、巴利语等)、本土化的西方借词(源自葡萄牙语、荷兰语等),甚至一些相对较新的借词,如pēzi"页面"。有时不同汉字用于区分同音异义词,类似于英语中的<sail>和<sale>;而有时,在意义、词形变化或传统上被认为相关的不同词素或词语会用同一个汉字书写。例如,固有词mato"目标"与汉日语素teki-使用同一个汉字,同样,固有词naka"内部"与tekitū"打中要害"中的汉日语素–tū使用同一个汉字。尽管其语音价值往往不透明,但汉字肯定不是表意文字,因为它在大多数日语文本中的主要功能与字母文字或任何其他人类语言书写系统相同:即使近似,也要记录口语的声音。汉字有时被描述为形态型或表语型,德弗兰西斯(1984)则提出了"形态音节型"这一术语。

尽管日本政府为汉字使用制定了标准,但使用中的变异及其形态音节特性可能造成歧义,使人难以确定汉字所要记录的是哪个词语。因此,在语料库中检索汉字形式的检索词时,必须通过核查其语境来确认其"读音"——即它所代表的口语词汇、词素或音节。由于词语可能根据传统、视觉效果等以不同书写系统交替使用,某些术语需要以多种正字形式进行检索(在演示版BCCWJ中可通过布尔运算符实现)。

日本国立国语研究所的抽样方法实际上以字符而非词为基础。前川(2007)在解释国立国语研究所编制的自发言语语料库(CSJ)的词数估算公式时警告说:"日语的词边界在很大程度上依赖于理论,因此不体现在普通正字法中。"然而,正如辛克莱(2004)和克雷奇马(2009)所证明的,任何语言中的词边界都"在很大程度上依赖于理论",因此也可以说,正字法本身加剧甚至造成了这一问题。

裸眼(無助视器官的眼睛):ragan与nikugan

辛克莱(2004)对"naked eye(肉眼)"这一例证表达作出如下分析(34):

说话者/写作者选择了一种应用于可见性语义偏好的困难语义韵。语义偏好控制着搭配和同现句法模式,分为动词(典型地为see)和形容词(典型地为visible)。与see等搭配时,存在与情态动词——尤其是表达困难的cancould——的强同现句法,以及与前置词with的连接以衔接最终成分。与visible等搭配时,搭配模式主要与程度副词以及否定词素in-共现;后接前置词为to。该项目的最终成分是核心,即几乎固定不变的短语the naked eye

正如他所指出的,这个短语在语义上是不透明的;"视觉器官未穿着任何东西"(2004: 31)不足以推断其意义,而"naked eye中的naked同样也可以意指……'没有眼镜、隐形眼镜等'"(31)。事实上,日语中恰好有这样一个词——裸眼(ragan),这是一个由词素/ra/"裸"(例如ratai"裸体")和/gan/"眼"(例如gankyū"眼球")构成的汉日复合词,定义为"不借助矫正镜片的眼睛"(近藤·高野 2001)。BCCWJ中共有20例裸眼,与siryoku"视力"共现11次(4次出现在N+1位置,构成复合词ragansiryoku"未矫正视力";参见附录1)。由于裸眼在N+1位置与工具格助词de共现9次,如ragan-de mi-te(裸眼-工具格 看-副动词),可以假定其与de存在同现句法关系。语义偏好可描述为"可见性";eiga"电影"、pasokon"电脑"、yomi"阅读"等视觉活动出现在节点词左侧。然而,其语义韵与英语naked eye有所不同。用于眼镜处方的数值出现在11行中,4行包含warui"差"作为对me"眼睛"的评价:裸眼暗示着眼科学的语义韵。

英语的naked eye更接近于日语的肉眼(nikugan)。词素/niku/"肉"(例如nikutai"(物质的)身体")与/gan/"眼"结合构成/nikugan/,定义为"人体所具有的眼睛;不借助望远镜、显微镜等的自然视力"(《大辞泉》1998)。BCCWJ中共有86例肉眼,与miru"看"(各种活用形)共现69次(参见附录2)。在N+1位置,工具格助词de出现在70%的例句中(另有两例仅将肉眼和de分隔开,中间插入其他工具词形成列举)。与后缀teki的共现使肉眼在14例中成为形容词("宏观的"之义);在这些情况中的71%(占总数的8.6%),肉眼以复合词nikugantekiketunyō"肉眼可见血尿"的形式出现。与miru"看"(合并活用形)的80%共现率,以及与kansatu"观察"的额外14%共现率,再次表明其语义偏好为"可见性"。在与miru共现的例子中,72%涉及可能性表达,肉眼可见某物的可能性与不可能性表达之间的比例为26:24;肉眼似乎与naked eye具有类似的语义韵,辛克莱(2004)将后者描述为"困难"(33),"可能仅由can或could等情态动词暗示,或更直接地由带'可见性'的否定表达"(43)。例如:

nikugan-de mi-e-ru wakusei

肉眼-工具格 看-可能-非过去 行星

"肉眼可见的行星"

肉眼看不到某物的情况占全部例子的29%,如:

nikugan-de-wa mi-ru-koto-ga deki-nai mikuro-no-sekai

肉眼-工具格-主题 看-事-主格 能-非过去 否定 微观-属格-世界

"肉眼无法看到的微观世界"

肯定语境中肉眼的使用似乎暗示可见性不同寻常,如:

Tusima-kara taigan-no-kankoku-o nikugan-de nozomu-koto-ga dekiru

对马-从 对岸-属格-韩国-目的格 肉眼-工具格-事-主格 可能

"从对马岛可以用肉眼眺望对岸的韩国"

语块表达:吃苦头/遭殃(痛い目に遭う,itai me ni au)

我们接下来要考察的短语,itai me ni au"遭遇麻烦",表现出强烈的语块倾向。《大辞泉》(1998)收录了该完整短语,定义为:"经历痛苦或磨难;有一次糟糕的经历",并列出同义短语hidoi me ni au和itai me o miru。短语me ni au"有某种经历"在BCCWJ中出现600次,其中约8%为itai me ni au。短语itai me出现65次(参见附录3)。其中72%以某种形式出现在itai me ni au这一短语中:

yudan-si-te-i-ru-to, ita-i me-ni a-u-kara-ne! (24)

疏忽-做-副动词-是-非过去-条件, 痛苦-非过去 经历-到 遭遇-非过去

"因为如果你不注意就会遭殃!"

另有26%出现在itai me o miru中:

te-o-da-su-to ita-i me-o-mi-ru (61)

手-目的格-伸出-非过去-条件 痛苦-非过去 经历-目的格-看-非过去

"如果你出手就会吃苦头"

在同现句法方面,itai me ni au在助词使用上几乎没有变异:itai me ni(ni格)出现46次,itai me ni mo(ni mo格)出现1次。itai me o miru的17例则显示出一般情况下目的格助词o的常见变异:5例省略(61:itai me miru)和1例话题化(62:itai me wa mite mo sikata nai)。

结论

在考察了三种语言特征之后,我们应注意到一个反复出现的分布规律:肉眼中de的70%共现率和miru的80%共现率,miru搭配词内部72%的可能性表达,以及所有itai me例子中与ni au的72%共现率。这些分布体现了80/20法则;换言之,A形曲线分布"鲁棒"到足以在我们的初步统计分析中就能显现(参见附录4)。无论选择哪种语言特征——助词(词素)、词语还是短语——BCCWJ数据都表现出言语学所预期的显著聚类现象。当BCCWJ数据完全发布时,语言学家们有充分理由相信自己将作出新的发现。

参考文献

  1. Aronoff, Mark, and Kirsten Anne. Fudeman. "Words and Lexemes." What Is Morphology? Malden, MA: Blackwell Pub., 2005. Print.
  2. Barfield, Andrew, and Henrik Gyllstad. Researching Collocations in Another Language: Multiple Interpretations. New York: Palgrave Macmillan, 2009. Print.
  3. DeFrancis, John. "The Ideographic Myth." The Chinese Language: Fact and Fantasy. Honolulu: University of Hawaii, 1984. Web. 2 Dec. 2010.
  4. Digital Daijisen. Tokyo: Shogakukan, 1998. Web. 2 Dec. 2010.
  5. Hasegawa, Yoko. "The Tense-aspect Controversy Revisted: The -ta and -ru Forms in Japanese." Pragmatics in 1998: Selected Papers from the 6th International Pragmatics Conference. Ed. Jef Verschueren. Vol. 2. Antwerpen: International Pragmatics Association, 1999. 225-40. Web. 3 Dec. 2010.
  6. "Kokuritsu Gengo Kenkyūsho No Gengo Kōpasu Seibi Keikaku Kotonoha." National Institute for Japanese Language and Linguistics. Web. 03 Dec. 2010. <http://www.ninjal.ac.jp/kotonoha/>.
  7. Kondō, Ineko, and Fumi Takano. Puroguresshibu Waei Chūjiten ["Progressive" Japanese-English Dictionary]. 3rd ed. Shogakukan, 2001. Kotobank. Web. 5 Dec. 2010.
  8. "Kotonoha Gendai Nihongo Kakikotoba Kinkō Kōpasu Kensaku Demonsutorēshon." National Institute for Japanese Language and Linguistics. Web. 11 Nov. 2010. <http://www.kotonoha.gr.jp/demo/>.
  9. Kretzschmar, William A., Jr. "The 80/20 Rule in English Grammar." Proc. of NAES-FINSSE 2010, Oulu. Web. 5 Dec. 2010.
  10. Kretzschmar, William A., Jr. The Linguistics of Speech. Cambridge: Cambridge UP, 2009. Print.
  11. Maekawa, Kikuo. "Balanced Corpus of Contemporary Written Japanese." Proc. of The 6th Workshop on Asian Language Resources, 2008, Hyderabad, India. Web. 1 Dec. 2010.
  12. Maekawa, Kikuo. "KOTONOHA and BCCWJ: Development of a Balanced Corpus of Contemporary Written Japanese." Corpora and Language Research: Proceedings of the First International Conference on Korean Language, Literature, and Culture. Seoul, 2007. Web. 4 Dec. 2010.
  13. Maekawa, Kikuo. "Quantitative Analysis of Word-form Variation Using a Spontaneous Speech Corpus." Proc. of Corpus Linguistics 2005, Birmingham. Web. 4 Dec. 2010.
  14. Sano, Motoki, and Takehiko Maruyama. "Lexical Density in Japanese Texts: Classifying Text Samples in the Balanced Corpus of Contemporary Written Japanese (BCCWJ)." Proceedings of ISFC 35: Voices Around the World. Ed. Canzhong Wu, Christian M.I.M. Matthiessen, and Maria Herke. Sydney, 2008. Web. 4 Dec. 2010.
  15. Sinclair, John, and Ronald Carter. "The Search for Units of Meaning." Trust the Text: Language, Corpus and Discourse. London: Routledge, 2004. Print.
  16. Thomson, Elizabeth A. "Theme Unit Analysis: A Systemic Functional Treatment of Textual Meanings in Japanese." Functions of Language 12.2 (2005): 151-79. Web. 4 Dec. 2010.
  17. Tsujimura, Natsuko. An Introduction to Japanese Linguistics. Malden, MA: Blackwell Pub., 2007. Web. 2 Dec. 2010.

附录1:裸眼(ragan)

表示番号前文脈検索文字列後文脈
1をかえてもらおうと思っています。  私は裸眼0.05です。  1番見えるようにしてと
2も年々増加傾向にある。次に高いものは,「裸眼視力1.0未満の者」であり,小学校20.
3も年々増加傾向にある。次に高いものは,「裸眼視力1.0未満の者」であり,小学校19.
4以上の疾病異常である。2 「近視」とは,裸眼視力1.0未満のもので矯正視力検査の結果
5硬い文章を読み慣れていない方だけでなく、裸眼視力二・〇のわたしでさえ、虫眼鏡の力を借
6あんまり効かないので、、、^^; でも、裸眼のままだと辛いです。 目が悪いのでコンタ
7も 1.2が限界みたいです。  あなたの裸眼にもよって  合わせられる度が違うと思い
8しても思うツボなわけじゃん。凄い男だな。裸眼でGO!(吉田美紀子)『オフィスグッズ』
9方の目が遠視だということがわかりました。裸眼で1.0と悪いほうの眼は0.5~0.8く
10? 0.3なのですが、映画・運転以外は、裸眼で通しています。 メガネが似合わない・コ
11視力が悪いのに無理して裸眼で見て目つきが悪くなっている女性と、メガ
12れば、覗きは一瞬の行為である。まず近視の裸眼で見て、入浴を確かめてから眼鏡をかけるな
13視力があり約一メートルの近距離であれば、裸眼で十分目的を達しうるものであることは経験
14もなかった。が、「君は大丈夫、そのままの裸眼で充分立派な視力だと思うよ」と説明しても
15けど例えば視力が0.5とか0.6だったら裸眼でも生活上支障はないなら受ける必要性はな
16対象という意味かもしれません)どうしても裸眼での視力を回復させたい、という方にはもっ
17しかし、車とパソコンと人を探すとき以外は裸眼です。 もちろんテレビも。 ちゃんと2m
18ほうがいいことってなんですか? 今までは裸眼です。 あまり強いものだと、慣れるまで 
19タクトが面倒・怖いという理由で、なるべく裸眼でいたいのですが・・・。 現在視力0.1
20目撃したのは、わずか数秒間、視力〇・一の裸眼で、一度に顔全部は見えないような細い透き

摘自BCCWJ演示版(http://www.kotonoha.gr.jp/)。

附录2:肉眼(nikugan)

表示番号前文脈検索文字列後文脈
1観察する。何種類かの葉を観察する。(4)肉眼,水滴レンズ,ルーペの観察結果について,
2って観察しよう 昔の人になったつもりで,肉眼,水滴レンズ,ルーペで身近なものを観察し
3ついただいて、比べてみました。種子の翼は肉眼(私はド近眼)ではよく見えません。10倍
4く知っていて郭清しなければなりません。 肉眼的(触診や視診)には、転移の有無がわから
5ひいたときにはじめて目で見てわかる血尿(肉眼的血尿)が出た。それを見てお母さんはかな
6れば、患児は数日間活動を抑えてもよい。 肉眼的血尿発作回数が運動制限によって減ること
7う。 「腎障害に対する特殊な治療はない。肉眼的血尿発作はひとりでになおるものであり、
8ことが多いです。●臨床像顕微鏡的あるいは肉眼的血尿を伴い、患側の腎部殴打痛を認めます
9床的に高度蛋白尿や高血圧の存在があるが、肉眼的血尿やネフローゼ症候群は関係がない。こ
10尿で発症する例もあるが,この場合は数日で肉眼的血尿は消失し,その後顕微鏡的血尿が持続
11+3の結果が出て、再検しても同様でした。肉眼的血尿はみられません。最近は両側背の痛み
12れなりに検査、治療してると思うので。  肉眼的血尿はなくとも、3+は安心できる値では
13発見される例が多い.上気道感染に引き続き肉眼的血尿で発症する例もあるが,この場合は数
14見されることが多く、上気道炎や下痢の時に肉眼的血尿がみられたり、急性腎炎症候群やネフ
15     素晴らしい展望です♪     肉眼的には申し分ない、展望ですが、     
16、一六二八年のことである。ハーヴィーは、肉眼的な観察によって、動脈から器官に入った血
17筋肉(上腕二頭筋)とかである。こういう、肉眼的な形のある構造を器官(organ)とい
18開け、コックピットから半身を乗り出すや、肉眼のみを頼りに照準を試みたのだ。 高度はあ
19魂  = 太陽 =5次元★闇の力の根源は肉眼に見える月ではなく、肉眼に見えない黒い月
20★闇の力の根源は肉眼に見える月ではなく、肉眼に見えない黒い月である、リリットから来る
21と思う」と述べている。たしかに、かつての肉眼による魚骨採集では、東京湾奥の中期貝塚と
22でした。そんな大感動のサクラタデですが、肉眼とレンズを通したのとでは、まるっきり色合
23にして,これを感材に密着しRIの分布像を肉眼で観察するものである.マクロオートラジオ
24着が近づく。 着弾時の水柱が、はっきりと肉眼で視認できる位置に噴き上がり、海水を伝わ
25測定方式及びマルチバンドカメラを利用して肉眼で視認できない海中の噴出物等の状況をは握
26ウン管は元々残像を利用しているのです。 肉眼で見ると一枚のようですが、レーザーでビー
27処から発射されるのでしょうか?その様子を肉眼で見ることは出来るものでしょうか? 打上
28 地球の表面の三分の二は海だし、私たちが肉眼で見ることのできるのは海面というただの皮
29相関図に気付くはずがない。 彼らが実際、肉眼で見ることのできた渦の形といえばなんだろ
30学を超えなければならないのです。 人間が肉眼で見ることができる宇宙の星は、何百光年、
31大きなものが出来上がっていく。われわれが肉眼で見ることができるのは、三原子体以上であ
32みたが、いうほど高品質にも見えなかった。肉眼で見てもそうだし、顕微鏡で見てみても、そ
33移動撮影しているときこそ、まだ足で立って肉眼で見ている生の経験に近いが、受容者にとっ
34、「共産主義の支配」という歴史的必然性を肉眼で見たと思ったのだろう。弾圧に屈せず、戦
35たエネルギーの量を意味している。地球から肉眼で見たときの等級を見かけの等級といい,こ
36ります。25パーセクで7等星になります。肉眼で見える限界は、5等か6等だったと思いま
37治の頃からのようです。  七曜というのは肉眼で見える惑星の火星・水星・木星・金星・土
38うな場所があるのか。 人間の身体の中に、肉眼で見えるような形のある構造がいくつもある
39る】 仏といっても浄土といっても、それは肉眼で見えるものではありません。絵像や木像の
40輝く星が見えたのですが、 もしかしたら、肉眼で見えると話題になっている、彗星でしょう
41見えない光」をまとめて「電磁波」と呼ぶ。肉眼で見える「可視光」は電磁波のほんの一部に
42る。電波は,太陽のような恒星はもちろん,肉眼で見えない低温で希薄なガスの中の分子や原
43し、話をしません。しかし神父はその姿形が肉眼で確認できるし、話もする、悩みも聴いてく
44の団体でわさわさと海から上がってくるので肉眼で確認できますが、けっこう小さいので、双
45でしょうかね???????? 毛じらみは肉眼で確認できます。もし毛じらみを見つけられ
46ャーでも解ります。 PCのケース開けたら肉眼で確認できます。
47れいに晴れた日なら、対馬から対岸の韓国を肉眼で望むことができる。対馬海峡は朝鮮半島ま
48なりません。「私の中に何かが生きている。肉眼で世界の色彩と形態を見、芸術的に変容させ
49がった空に浮かぶ黒い機影が、地上からでも肉眼でハッキリと確認できた。「撃て! 撃て!
50らないのでしょうか? 再生はできますが、肉眼でカビが見えるなら 画質はひどいですよ。
51アンデスの山からは星々が美しく見えます。肉眼でも八千個にのぼる星を見ることができます
52) 生物の部分を拡大する 私たちはふだん肉眼でものを見ているが,詳しく観察するために
53トを、土、日曜をかけて観察する。もとより肉眼でみえる世界ではなく、高倍率の顕微鏡をも
54なる動物,植物,魚がいる.しかし,これは肉眼でみえる世界での生物にすぎない.実は,海
55:0.025倍)(B) 連星とその質量 肉眼では1つにしか見えない恒星でも望遠鏡では
56ものを見ているが,詳しく観察するためには肉眼では限界がある。そこでレンズという道具を
57てみよう。 人体の最小単位は細胞である。肉眼では見ることができないミクロの世界から出
58舞台には音声装置がありません。この舞台は肉眼では見られません。舞台も演者も観客もその
59いう。フィルムとフィルターのいたずらが、肉眼では見えぬ地下の遺跡を透視するのだと、そ
60。ごらんになれますでしょうか、小さすぎて肉眼では見えにくいかもしれません。もともと虫
61物でも存在がたしかなものは沢山あります。肉眼では見えなくても、顕微鏡のような眼鏡をか
62あるが、トールキンは指輪の姿を消す原理を肉眼では見えない霊的な世界に行ったためと説明
63している。彼らは土を「食」として、私達の肉眼では見えない生命現象を果てしもなく行って
64だくのです。 前にも述べましたが、仏壇も肉眼では見えない浄土をあらわそうとしたもので
65らにたどっていくと、枝分かれを繰り返して肉眼では見えないほどに細くなってしまう。静脈
66うなもようが見える。このことから,金は,肉眼では見えないきわめて小さな粒子が規則正し
67っていると思われますので、どちらか一つは肉眼では見えないかもしれません。 条件が良い
68、小さな球がいっぱい詰まっている。むろん肉眼では見えず、顕微鏡を使って初めてわかる。
69腎炎というものは蛋白尿と、顕微鏡的血尿(肉眼では血液がまじっていることがわからないが
70すのは、簡単なようでなかなかできません。肉眼では立体的に見えるんですが、写真のような
71ら、千年二千年前の遺跡を発見する技術で、肉眼では決して見ることのできない地下の遺跡が
72したイラク軍の位置をGPSに入力し、全く肉眼では敵が見えない状態でも長距離砲弾、多連
73、高精度のデジタルカメラや赤外線などで、肉眼では描線が見えない白虎の背中や目、前脚な
74あった。 十一月末のレントゲン写真では、肉眼ではもうほとんど見えないくらいまで消えて
75,湖など水中あるいは土の中や大気中にも,肉眼ではみえない数多くの生物が生存しているの
76利用〈微生物とよばれるもの〉 生物の中で肉眼ではほとんど見えず,顕微鏡や電子顕微鏡で
77ップです、いろんな角度から見た写真です。肉眼ではなかなか見つけられない形もアップにす
78テラノーバという寄生虫らしいのですが、 肉眼ではっきり確認できるものなのでしょうか?
79ンデジで撮った夜景。今度は暗すぎる?! 肉眼ではすごく大きく見えました!!そして、と
80報により 高台へ ゆきました。  肉眼では うっすら 見えたのですが・・・。う
81して観察することになる。レンズを使うと,肉眼での観察に比べてどのような見え方の違いが
82紀になって望遠鏡が発明されるまで,天体は肉眼でしか見ることができなかった。しかし16
83。陽性か陰性かの最終判定は検査技師たちの肉眼で。(同)献血は「危険物」? さて、血液
84について,下の考察の観点から話し合う。・肉眼だけのときとレンズを使ったときとでは見え
85し)かの判定は、最終的には検査技師たちの肉眼が下すそうだ。 と同時に、別の検体は「N
86照射方法 照射方法は2種に大別されます。肉眼、直視下でハンドピース(CO2)またはロ

摘自BCCWJ演示版(http://www.kotonoha.gr.jp/)。

附录3:痛い目に遭う(itai me ni au)

表示番号前文脈検索文字列後文脈
1けられない」「一度、友達の保証人になって痛い目みてるから無理」でしょうか。 兎に角、金
2にも三千にも見えたのである。 木曾軍に手痛い目に合わされた信長は木曾軍に対して恐怖をお
3情的にからんできます。 他の営業マンから痛い目にあっているので、お返しのつもりとも受け
4  こんな回答を書き込むと、以下のような痛い目にあいます。  上に挙げた例のように物理
5び人 ではないんじゃないでしょうか?  痛い目みますよ  既婚者はパートナーのところに
6入れとくのが無難。[ 印象 = 軽視して痛い目に合わされやすい ]●7枠14番=リキッ
7走ってましたから。  サンライズは宝塚で痛い目にあってましたのでいつかはと思ってました
8もあります。 ドライブを値段だけで選ぶと痛い目にあいます。 お勧めはRAM不要ならパイ
9んですけどね〜♪さすがに無理すると年明け痛い目みるよ思いまして安静にしてました(*^皿
10陥れ、四月には、遠州森の一之瀬で徳川軍を痛い目に合わせた。その昌幸が長島に潜入して、軍
11たタビのことを思い出し、「ああ、大ボス、痛い目にあって辛かったんやね。もう二度と帰って
12ら、値動きが荒っぽくて、高値づかみすると痛い目にあいます。この荒い値動きに食いつくため
13いけないのです。なぜ? 今痛くても、後で痛い目をしなくてすむからなんです。今注射をしな
14ない感じがします、新米オーナー様のほうが痛い目に有った分良い文章が書ける感じがします。
15な気がした。このままではいずれこちらが手痛い目にあわされるのではないか。このアメリカ人
16仕事はありません。 世の中なめてかかると痛い目にあいますよ。   兜町のクワガタムシ
17てやるつもりだった。体に痕の残らぬ程度に痛い目を見せて、剣を手から打ち落としてやればあ
18リノスも不安だな。」セイジ「マリノスには痛い目に遭いまくったからね。これが結末になるこ
19んとしても対面させたかった。ハーウッドが痛い目にあわされるのはまちがいない。やつは女に
20てきませんでしたけどね。あんなやつは早晩痛い目にあいますよ。てかあってもらわなきゃ困る
21。娘を殴ったら、お袋さんが騒いでな。少し痛い目を見たようだ」 亜紀子は目を伏せた。 あ
22同じようについついインターネットをすると痛い目に遭いますよパケ放題は、日本国内からのア
23鮮な驚きを与えました。そこには、ときには痛い目にも遭いながら、わたしが現実から教えられ
24もっこり』 だけどぉ・・・油断してると、痛い目にあうからねぇ!  (ノ∇^*) キャハ
25 ちなみに旦那は以前、風俗で病気移されて痛い目を見てるので、風俗には行かないと言ってま
26ないか…これらの機器に全幅の信頼をおくと痛い目に遭うかもしれない。
27!! そんな事も知らずに、ネットしてたら痛い目に会うぞ!!!  しかしまだそのネタして
28 ま、世の中平等なら、そんな会社もいずれ痛い目にあうでしょうね。 無謀な勤務実態は明る
29もやっぱりそうです。なんていうか、実際に痛い目を見ることになる前に、防衛本能が働くんで
30混じりに答えた。「ただ、舞い上がってると痛い目に遭うから、ほどほどにね」 そしてスキッ
31かり気にして、男と男てえ関係を忘れてると痛い目に会うという…」 「男と男ねえ、なるほど
32ね。これで久保田は大丈夫と思ったら、また痛い目にあうと思うんだけど・・そして最後は藤川
33な男なのだ。本気になってしまったら自分が痛い目を見るだけだとわかっているが、黒坂はいち
34たからです」 梶田の過去を探りまわるな。痛い目に遭うぞ。そこまではいい。だが、問題はそ
35っているのですか―」 「以前に、一度、手痛い目に会わされたことがある」 「力の加減を知
36き人間が自分に知恵が足りないことによって痛い目にあうのである。 こういったことを言って
37らって結婚すれば~? そうですよね~  痛い目を見る前に、 目がさめて欲しいですよね・
38るのですがこれは見極めを間違うとドエライ痛い目に遭うのでまた次回お話しようと思います。
39」 典善も、小さく口元をゆるませた。 手痛い目に会わされたと言ってはいるが、この男も乱
40迷惑かけます。 だいたい貧血をあまくみて痛い目にあうひと多いです。 とかいって、私は「
41みたって無益なのかもしれませんから。と、痛い目を見る度に、そうやって自分を正当化して振
42いますが。今の世の中ぬくぬくしている人が痛い目に遭うのもそお遠くないでしょう、政治では
43で登録して一人と知り合いましたが 結果、痛い目に合いました。 結婚したいという目的は同
44てわかったの。何事も、TPOを守らないと痛い目にあうんだ、って。夏祭りの夜、ちゃんと誘
45う。今回のオリンピックは、真面目な人ほど痛い目を見る気がします。それは北京オリンピック
46こをきちんと考えなければいけない。実際、痛い目に遭っているのは住民なのだ。だから事故が
47いいかげんな応対をしていては、あとで必ず痛い目に合う。親しみをもって近づく あるソフト
48 体がそれを覚えるまでどんな苦労や失敗や痛い目にあったか、裸馬の背骨で腿がすり切れたり
49のがわからないんでしょうか?? ちょっと痛い目見たほうがいいですねぇ~。ドラ1で入って
50は、緊張した声で、「何かあったのか」 「痛い目に遭わされたようです。そう言っていました
51か? 両方!! 外見だけ見て判断してると痛い目に合うし、 中身だけだと、飽きる。 だか
52軍のマスコミ操作報道により戦争につっ走り痛い目にあったことを忘れたのか! 一日も早く基
53なくこっちに回してきやがったのさ。体練で痛い目見りゃあ嫌でも気が変わるだろうってな。そ
54に慣れていますね」 「記者にはいろいろと痛い目に遭わされているからな。大切なのは、こち
55じゃあ、誰のだと言うんだ。答え次第では、痛い目に合うぞ」 「伍長」隅倉は荒巻に言った。
56言わなかった。一号機の第一回定期点検の時痛い目にあったことを忘れていなかったのである。
57えのチームメイトのお嬢さんたちも、みんな痛い目見ることになるぞ。俺たちの組織にはな、ち
58求されるというようなことで、大変消費者が痛い目に遭わされるというような場合があるようで
59けます。  若者はまだ未来があるので将来痛い目に合うだろうからいいけど、  若者に限定
60昨年十一月の加藤政局で、加藤さんが一番手痛い目にあった人だ。それなら、加藤派からだれか
61。  彼女や人妻に言い寄られて手を出すと痛い目見るのでやめましょう。パートナーを裏切る
62いる。吉岡の喜ぶ顔を見るためなら、少々の痛い目は見てもしかたないと、あぐりは静かなる絶
63さらではないか。 西洋でも、これらにより痛い目に合ったという事例が事欠かないのだろう。
64真田昌幸の指揮する乱破部隊に捕捉されて手痛い目にあって、城に逃げ込もうとする。その後を
65ね。 こういう一人の為に銀魂ファン全体が痛い目で見られるのがつらいです。

摘自BCCWJ演示版(http://www.kotonoha.gr.jp/)。

附录4:肉眼搭配词的分布

Mi- "看" 69

mie- 41

miena- 17

mienai 15

nikugan de wa mienakute mo 1

iu hodo kōhinsitu ni wa mienakatta 1

mieru 13

miezu 2

mieta 2

miemasen 1

miemasu 1

miemasita 1

nikugan de wa mienikui 1

nikugan de wa mienu 1

mie (行尾) 1

nikugan de no kansatu ni kurabete dono yō na miekata no tigai 1

miru 10

nikugan de miru to itimai no yō desu ga 1

miru koto 9

nikugan de miru koto wa dekiru 1

nikugan de miru koto no dekiru 1

nikugan de miru koto no dekita 1

nikugan de miru koto ga dekiru 1

hosi o miru koto ga dekimasu 1

nikugan de wa miru koto ga dekinai 1

nikugan de wa kessite miru koto no dekinai 1

tentai ha nikugan de sika miru koto ga dekinakatta 1

mite 6

nikugan de mite mo sō da si 1

kenbikyō de mite mite mo 1

me de mite wakaru 1

sore o mite 1

nikugan de mite iru nama no keiken 1

nikugan de mono o mite iru ga 1

mirare- 3

miraremasen 2

nikugantekiketunyō wa miraremasen 1

nikugan de wa miraremasen 1

miraretari 1

nikugantekiketunyō ga miraretari 1

mita 3

nikugan de mita 2

ironna kakudo kara mita syasin 1

mitukerare- 2

mitukerare 1

mitukerarenai 1

mikake 1

mi 1

Kansatu "观察" 12(常出现于肉眼附近,但与肉眼无同现句法关系)

Kenbikyō "显微镜" 9(常与肉眼形成对比)

Kakunin "确认" 6

Nikugan de kakunin dekimasu 3

Nikugan de kakunin dekiru 1

Nikugan de hakkiru to kakunin dekita 1

Nikugan de hakkiri kakunin dekiru 1

Sinin "目视确认" 2

Nikugan de sinin dekiru 1

Nikugan de sinin dekinai 1

Hakkiri "清楚地" 3

Hakken "发现" 2

Bōenkyō "望远镜" 2

Nozomu "眺望" 1

根据附录2中的BCCWJ数据汇编。

esc