10bet网址
MySQL 5.6リファレンスマニュアル
本手册下载
PDF (Ltr)- 26.8 mb
PDF (A4)- 26.8 mb


12.9.4全文ストップワド

サバ文字セットおよび照合順序(character_set_serverおよびcollation_serverシステム変数の値)を使用すると,全文クエリ。全文邮箱ンデックス作成または検索で使用されるストップワ邮箱ドファ邮箱ルまたはカラムに,character_set_serverまたはcollation_serverとは異なる文字セットまたは照合順序が含まれている場合は,ストップワード検索で誤ったヒットまたはミスが発生する可能性があります。

ストップワド検索で大文字と小文字が区別されるかどうかは,サ照合順序によって異なります。たとえば,照合順序がlatin1_swedish_ciの場合は検索で大文字と小文字が区別されませんが,照合順序がlatin1_general_csまたはlatin1_binの場合は検索で大文字と小文字が区別されます。

InnoDB検索ンデックスのストップワド

技術的,文学的,およびその他のソースからのドキュメントでは,キーワードとしてまたは重要なフレーズで短い単語が使用されることが多いため,InnoDBではデフォルトのストップワドリストが比較的短くなります。たとえば,生存还是毁灭を検索し,これらの単語がすべて無視されるのではなく,適切な結果が取得されることを期待するとします。

デフォルトのInnoDBストップワドリストを確認するには,INFORMATION_SCHEMA。INNODB_FT_DEFAULT_STOPWORDテブルを問い合わせます。

SELECT * FROM INFORMATION_SCHEMA.INNODB_FT_DEFAULT_STOPWORD;+-------+ | 价值  | +-------+ | 大约一个| | | |的| |是| |是| |的| |是| |的| | com | |德| | en | |的| |的| | |如何我| | |中| |是| |是| | la |的| | |的| |和| |:| |的| |这| |,| |是| |是| |当| |中| |谁| |将| |和| |和| |的| | www  | +-------+ 36行集(0.00秒)

すべてのInnoDBテブルで独自のストップワドリストを定義するには,INNODB_FT_DEFAULT_STOPWORDテブルと同じ構造を持テブルを定義し,それにストップワ,innodb_ft_server_stopword_tableオプションの値をdb_name/table_name形式の値に設定してから、全文以及ンデックスを作成します。ストップワドテブルには,价值という名前の単一のVARCHARカラムが含まれている必要があります。次の例では,InnoDB用に新しいグロバルストップワドテブルを作成および構成するよう実演します。

——创建一个新的stopword表mysql> Create table my_stopwords(value VARCHAR(30))mysql> Insert INTO my_stopwords(value) VALUES ('Ishmael');查询OK, 1 row affected (0.00 sec)——创建表mysql> Create table opening_lines (id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY, opening_line TEXT(500), author VARCHAR(200), title VARCHAR(200)) ENGINE=InnoDB;查询OK, 0行影响(0.01秒)——插入数据到表mysql> Insert into opening_lines(opening_line,author,title) VALUES ('Call me Ishmael。、《赫尔曼·梅尔维尔》、《白鲸》)、(“一声尖叫响彻天空。”,“托马斯品钦”,“万有引力的彩虹”),(“我是一个隐形人。,“拉尔夫·埃里森”,“隐形人”),(“现在在哪里?”现在谁?现在什么时候?','Samuel Beckett','The Unnamable'), ('It was love at first sight.','Joseph Heller','Catch-22'), ('All this happened, more or less.','Kurt Vonnegut','Slaughterhouse-Five'), ('Mrs. Dalloway said she would buy the flowers herself.','Virginia Woolf','Mrs. Dalloway'), ('It was a pleasure to burn.','Ray Bradbury','Fahrenheit 451'); Query OK, 8 rows affected (0.00 sec) Records: 8 Duplicates: 0 Warnings: 0 -- Set the innodb_ft_server_stopword_table option to the new stopword table mysql> SET GLOBAL innodb_ft_server_stopword_table = 'test/my_stopwords'; Query OK, 0 rows affected (0.00 sec) -- Create the full-text index (which rebuilds the table if no FTS_DOC_ID column is defined) mysql> CREATE FULLTEXT INDEX idx ON opening_lines(opening_line); Query OK, 0 rows affected, 1 warning (1.17 sec) Records: 0 Duplicates: 0 Warnings: 1

INFORMATION_SCHEMA。INNODB_FT_INDEX_TABLEで単語を問い合わせて,指定したストップワード(“以实玛利”)が表示されないことを確認します。

注記

デフォルトでは,長さが3文字よりも少ない単語または84文字よりも多い単語は,InnoDBの全文検索邮箱ンデックスに表示されません。単語の最大長および最小長の値は,innodb_ft_max_token_sizeおよびinnodb_ft_min_token_size変数を使用して構成できます。

SET GLOBAL innodb_ft_aux_table='test/opening_lines';查询OK, 0 rows affected (0.00 sec) mysql> SELECT word FROM INFORMATION_SCHEMA。INNODB_FT_INDEX_TABLE限制15;+-----------+ | 词  | +-----------+ | 在| |所有| |燃烧| |购买| |电话| |是| |史册。| |第一| | |花发生了| | | |她看不见| | |少| |喜欢| |男人  | +-----------+ 15行集(0.00秒)

ストップワドリストをテブルごとに作成するには,その他のストップワドテブルを作成し,innodb_ft_user_stopword_tableオプションを使用して使用されるストップワドテブルを指定してから,全文ンデックスを作成します。

MyISAM検索ンデックスのストップワド

MySQL 5.6では;character_set_serverucs2utf16utf16le,またはutf32の場合,ストップワルがlatin1を使用してロドおよび検索されます。

MyISAMテブル用のデフォルトのストップワドリストをオバラドするには,ft_stopword_fileシステム変数を設定します。(セクション5.1.4 "サバシステム変数"を参照してください)変数の値は,ストップワードリストを含むファイルのパス名,またはストップワードのフィルタ処理が無効になる空の文字列になるようにしてください。サーバーは,別のディレクトリを指定する絶対パス名が指定されないかぎり,データディレクトリ内のファイルを検索します。この変数の値またはストップワルの内容を変更したら,サ,全文ンデックスを再構築してください。

ストップワードリストは自由形式で,改行,空白,カンマなどの英数字以外の文字でストップワードが区切られます。例外として,下線文字(_)と単一アポストロフィ(は単語の一部として処理されます。ストップワドリストの文字セットは,サのデフォルト文字セットです。セクション10.1.3.1 "サバ文字セットおよび照合順序"を参照してください。

次の表には,MyISAM検索邮箱ンデックスのデフォルトのストップワ邮箱ドリストを示します。このリストは,MySQLソス配布の存储/ myisam / ft_static.cファ邮箱ルで検索できます。

一个的 能力 关于 以上 根据
相应的 实际上 后来
再一次 反对 不是 所有 允许
允许 几乎 独自一人 沿着 已经
虽然 总是
一个 而且 另一个 任何
任何人 不管怎样 任何人 任何东西 无论如何
不管怎样 在任何地方 分开 出现 欣赏
适当的 周围 作为
一边 相关的
可用 走了 非常 成为
因为 成为 就变成了 成为
之前 事先 后面 相信
下面 旁边 除了 最好的 更好的
之间的 除了 这两个 短暂的
通过 来吧 c 来了 可以
不能 不能 斜面 导致 原因
某些 当然 变化 很明显 有限公司
com 来了 有关 因此
考虑 考虑 包含 包含 包含
相应的 可以 不能 课程 目前
肯定 描述 尽管 做了 没有
不同的
完成 下来 向下
每一个 edu 八个 要么
其他的 在其他地方 足够的 完全 特别是
甚至 每一个
每个人都 每一个人 一切 到处都是 前女友
完全 例子 除了
第五 第一个 五个 之后
遵循 以前 出来
四个 进一步 此外 得到
得到 得到 鉴于 给了
走了 得到了 得到
问候 没有 发生 几乎没有
还没有 还没
他是 你好 帮助 因此
她的 在这里 这是 以后 在此
在此 于此 她的 自己
自己 他的 这里 希望
如何 然而 然而 我将
如果 忽略了
立即 因为 公司 事实上
表明 表示 表明 内心的 如果
而不是 向内 不是
它会 它会 这是 它的
本身 只是 保持 保持 保持
知道 已知的 知道 最后的 最近
晚些时候 后者 近来 至少
以免 让我们 就像 喜欢
可能 看起来
有限公司 主要是 许多 五月 也许
的意思是 与此同时 仅仅是 可能
更多的 此外 大多数 主要是
必须 我的 我自己 的名字
nd 附近 必要的 需要
需要 既不 从来没有 不过
下一个 九个 没有 没有人
没有一个 没有人 也不 正常情况下
没有什么 小说 现在 地方 很明显
经常 好吧
好吧 一次 一个
只有 其他
其他人 否则 应该 我们的 我们的
我们自己 整体
自己的 特定的 特别是 也许
放置 + 可能的 大概
可能 提供了 什么 相当 qv
理查德·道金斯 再保险 真的 合理的
关于 不管 问候 相对 分别
正确的 相同 看到
第二个 其次 看到
看到 似乎 似乎 表面上的 似乎
见过 自我 自我 明智的 发送
严重的 认真 七个 几个
应该 不应该 六个
所以 一些 有人 在某种程度上 一个人
某物 的某个时候 有时 有些 的某个地方
很快 对不起 指定的 指定 指定
仍然 这样的 吃晚饭 确定
t 采取 告诉 往往
th 谢谢 谢谢 谢谢
这是 这是 他们的
他们的 他们 自己 然后 那里
在那里 之后 从而 因此
其中 于是 这些 他们
他们会 他们会 他们 他们已经 认为
第三 彻底的 彻底 那些
虽然 三个 通过 通过
因此 在一起 花了
试着 真正的
试一试 尝试 两次 两个 联合国
不幸的是 除非 不太可能 直到
向上 我们 使用
使用 有用的 使用 使用 通常
价值 各种各样的 非常 通过
vs 想要 希望 不是
道路 我们 我们会 我们会 我们
我们已经 欢迎 好吧 去了
没有 什么 是什么 无论
那里 每当 在哪里 在哪里 随后
于是 无论
是否 哪一个 到哪里
是谁 整个 谁的
为什么 愿意 希望
没有 不会 想知道
不会 是的 然而, 你会
你会 你已经 你的 你的
你自己 你们自己

本手册下载
PDF (Ltr)- 26.8 mb
PDF (A4)- 26.8 mb