サバ文字セットおよび照合順序(character_set_server
およびcollation_server
システム変数の値)を使用すると,全文クエリ。全文邮箱ンデックス作成または検索で使用されるストップワ邮箱ドファ邮箱ルまたはカラムに,character_set_server
またはcollation_server
とは異なる文字セットまたは照合順序が含まれている場合は,ストップワード検索で誤ったヒットまたはミスが発生する可能性があります。
ストップワド検索で大文字と小文字が区別されるかどうかは,サ照合順序によって異なります。たとえば,照合順序がlatin1_swedish_ci
の場合は検索で大文字と小文字が区別されませんが,照合順序がlatin1_general_cs
またはlatin1_bin
の場合は検索で大文字と小文字が区別されます。
InnoDB検索ンデックスのストップワド
技術的,文学的,およびその他のソースからのドキュメントでは,キーワードとしてまたは重要なフレーズで短い単語が使用されることが多いため,InnoDB
ではデフォルトのストップワドリストが比較的短くなります。たとえば,「生存还是毁灭」を検索し,これらの単語がすべて無視されるのではなく,適切な結果が取得されることを期待するとします。
デフォルトのInnoDB
ストップワドリストを確認するには,INFORMATION_SCHEMA。INNODB_FT_DEFAULT_STOPWORD
テブルを問い合わせます。
SELECT * FROM INFORMATION_SCHEMA.INNODB_FT_DEFAULT_STOPWORD;+-------+ | 价值 | +-------+ | 大约一个| | | |的| |是| |是| |的| |是| |的| | com | |德| | en | |的| |的| | |如何我| | |中| |是| |是| | la |的| | |的| |和| |:| |的| |这| |,| |是| |是| |当| |中| |谁| |将| |和| |和| |的| | www | +-------+ 36行集(0.00秒)
すべてのInnoDB
テブルで独自のストップワドリストを定義するには,INNODB_FT_DEFAULT_STOPWORD
テブルと同じ構造を持テブルを定義し,それにストップワ,innodb_ft_server_stopword_table
オプションの値を
形式の値に設定してから、全文以及ンデックスを作成します。ストップワドテブルには,db_name
/table_name
价值
という名前の単一のVARCHAR
カラムが含まれている必要があります。次の例では,InnoDB
用に新しいグロバルストップワドテブルを作成および構成するよう実演します。
——创建一个新的stopword表mysql> Create table my_stopwords(value VARCHAR(30))mysql> Insert INTO my_stopwords(value) VALUES ('Ishmael');查询OK, 1 row affected (0.00 sec)——创建表mysql> Create table opening_lines (id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY, opening_line TEXT(500), author VARCHAR(200), title VARCHAR(200)) ENGINE=InnoDB;查询OK, 0行影响(0.01秒)——插入数据到表mysql> Insert into opening_lines(opening_line,author,title) VALUES ('Call me Ishmael。、《赫尔曼·梅尔维尔》、《白鲸》)、(“一声尖叫响彻天空。”,“托马斯品钦”,“万有引力的彩虹”),(“我是一个隐形人。,“拉尔夫·埃里森”,“隐形人”),(“现在在哪里?”现在谁?现在什么时候?','Samuel Beckett','The Unnamable'), ('It was love at first sight.','Joseph Heller','Catch-22'), ('All this happened, more or less.','Kurt Vonnegut','Slaughterhouse-Five'), ('Mrs. Dalloway said she would buy the flowers herself.','Virginia Woolf','Mrs. Dalloway'), ('It was a pleasure to burn.','Ray Bradbury','Fahrenheit 451'); Query OK, 8 rows affected (0.00 sec) Records: 8 Duplicates: 0 Warnings: 0 -- Set the innodb_ft_server_stopword_table option to the new stopword table mysql> SET GLOBAL innodb_ft_server_stopword_table = 'test/my_stopwords'; Query OK, 0 rows affected (0.00 sec) -- Create the full-text index (which rebuilds the table if no FTS_DOC_ID column is defined) mysql> CREATE FULLTEXT INDEX idx ON opening_lines(opening_line); Query OK, 0 rows affected, 1 warning (1.17 sec) Records: 0 Duplicates: 0 Warnings: 1
INFORMATION_SCHEMA。INNODB_FT_INDEX_TABLE
で単語を問い合わせて,指定したストップワード(“以实玛利”)が表示されないことを確認します。
デフォルトでは,長さが3文字よりも少ない単語または84文字よりも多い単語は,InnoDB
の全文検索邮箱ンデックスに表示されません。単語の最大長および最小長の値は,innodb_ft_max_token_size
およびinnodb_ft_min_token_size
変数を使用して構成できます。
SET GLOBAL innodb_ft_aux_table='test/opening_lines';查询OK, 0 rows affected (0.00 sec) mysql> SELECT word FROM INFORMATION_SCHEMA。INNODB_FT_INDEX_TABLE限制15;+-----------+ | 词 | +-----------+ | 在| |所有| |燃烧| |购买| |电话| |是| |史册。| |第一| | |花发生了| | | |她看不见| | |少| |喜欢| |男人 | +-----------+ 15行集(0.00秒)
ストップワドリストをテブルごとに作成するには,その他のストップワドテブルを作成し,innodb_ft_user_stopword_table
オプションを使用して使用されるストップワドテブルを指定してから,全文ンデックスを作成します。
MyISAM検索ンデックスのストップワド
MySQL 5.6では;character_set_server
がucs2
、utf16
、utf16le
,またはutf32
の場合,ストップワルがlatin1
を使用してロドおよび検索されます。
MyISAMテブル用のデフォルトのストップワドリストをオバラドするには,ft_stopword_file
システム変数を設定します。(セクション5.1.4 "サバシステム変数"を参照してください)変数の値は,ストップワードリストを含むファイルのパス名,またはストップワードのフィルタ処理が無効になる空の文字列になるようにしてください。サーバーは,別のディレクトリを指定する絶対パス名が指定されないかぎり,データディレクトリ内のファイルを検索します。この変数の値またはストップワルの内容を変更したら,サ,全文
ンデックスを再構築してください。
ストップワードリストは自由形式で,改行,空白,カンマなどの英数字以外の文字でストップワードが区切られます。例外として,下線文字(「_
」)と単一アポストロフィ(「'
」は単語の一部として処理されます。ストップワドリストの文字セットは,サのデフォルト文字セットです。セクション10.1.3.1 "サバ文字セットおよび照合順序"を参照してください。
次の表には,MyISAM
検索邮箱ンデックスのデフォルトのストップワ邮箱ドリストを示します。このリストは,MySQLソス配布の存储/ myisam / ft_static.c
ファ邮箱ルで検索できます。
一个的 | 能力 | 关于 | 以上 | 根据 |
相应的 | 在 | 实际上 | 后 | 后来 |
再一次 | 反对 | 不是 | 所有 | 允许 |
允许 | 几乎 | 独自一人 | 沿着 | 已经 |
也 | 虽然 | 总是 | 我 | 在 |
在 | 一个 | 而且 | 另一个 | 任何 |
任何人 | 不管怎样 | 任何人 | 任何东西 | 无论如何 |
不管怎样 | 在任何地方 | 分开 | 出现 | 欣赏 |
适当的 | 是 | 不 | 周围 | 作为 |
一边 | 问 | 问 | 相关的 | 在 |
可用 | 走了 | 非常 | 是 | 成为 |
因为 | 成为 | 就变成了 | 成为 | 被 |
之前 | 事先 | 后面 | 被 | 相信 |
下面 | 旁边 | 除了 | 最好的 | 更好的 |
之间的 | 除了 | 这两个 | 短暂的 | 但 |
通过 | 来吧 | c | 来了 | 可以 |
不能 | 不能 | 斜面 | 导致 | 原因 |
某些 | 当然 | 变化 | 很明显 | 有限公司 |
com | 来 | 来了 | 有关 | 因此 |
考虑 | 考虑 | 包含 | 包含 | 包含 |
相应的 | 可以 | 不能 | 课程 | 目前 |
肯定 | 描述 | 尽管 | 做了 | 没有 |
不同的 | 做 | 做 | 不 | 做 |
不 | 完成 | 下来 | 向下 | 在 |
每一个 | edu | 如 | 八个 | 要么 |
其他的 | 在其他地方 | 足够的 | 完全 | 特别是 |
等 | 等 | 甚至 | 过 | 每一个 |
每个人都 | 每一个人 | 一切 | 到处都是 | 前女友 |
完全 | 例子 | 除了 | 远 | 几 |
第五 | 第一个 | 五个 | 之后 | 后 |
遵循 | 为 | 前 | 以前 | 出来 |
四个 | 从 | 进一步 | 此外 | 得到 |
得到 | 得到 | 鉴于 | 给了 | 去 |
去 | 会 | 走了 | 得到了 | 得到 |
问候 | 有 | 没有 | 发生 | 几乎没有 |
有 | 还没有 | 有 | 还没 | 有 |
他 | 他是 | 你好 | 帮助 | 因此 |
她的 | 在这里 | 这是 | 以后 | 在此 |
在此 | 于此 | 她的 | 自己 | 嗨 |
他 | 自己 | 他的 | 这里 | 希望 |
如何 | 然而 | 然而 | 我 | 我将 |
我 | 我 | 即 | 如果 | 忽略了 |
立即 | 在 | 因为 | 公司 | 事实上 |
表明 | 表示 | 表明 | 内心的 | 如果 |
而不是 | 成 | 向内 | 是 | 不是 |
它 | 它会 | 它会 | 这是 | 它的 |
本身 | 只是 | 保持 | 保持 | 保持 |
知道 | 已知的 | 知道 | 最后的 | 最近 |
晚些时候 | 后者 | 近来 | 至少 | 少 |
以免 | 让 | 让我们 | 就像 | 喜欢 |
可能 | 小 | 看 | 看 | 看起来 |
有限公司 | 主要是 | 许多 | 五月 | 也许 |
我 | 的意思是 | 与此同时 | 仅仅是 | 可能 |
更多的 | 此外 | 大多数 | 主要是 | 多 |
必须 | 我的 | 我自己 | 的名字 | 即 |
nd | 附近 | 近 | 必要的 | 需要 |
需要 | 既不 | 从来没有 | 不过 | 新 |
下一个 | 九个 | 没有 | 没有人 | 非 |
没有一个 | 没有人 | 也不 | 正常情况下 | 不 |
没有什么 | 小说 | 现在 | 地方 | 很明显 |
的 | 从 | 经常 | 哦 | 好吧 |
好吧 | 老 | 在 | 一次 | 一个 |
的 | 只有 | 到 | 或 | 其他 |
其他人 | 否则 | 应该 | 我们的 | 我们的 |
我们自己 | 出 | 外 | 在 | 整体 |
自己的 | 特定的 | 特别是 | 每 | 也许 |
放置 | 请 | + | 可能的 | 大概 |
可能 | 提供了 | 什么 | 相当 | qv |
而 | 理查德·道金斯 | 再保险 | 真的 | 合理的 |
关于 | 不管 | 问候 | 相对 | 分别 |
正确的 | 说 | 相同 | 看到 | 说 |
说 | 说 | 第二个 | 其次 | 看到 |
看到 | 似乎 | 似乎 | 表面上的 | 似乎 |
见过 | 自我 | 自我 | 明智的 | 发送 |
严重的 | 认真 | 七个 | 几个 | 应 |
她 | 应该 | 不应该 | 自 | 六个 |
所以 | 一些 | 有人 | 在某种程度上 | 一个人 |
某物 | 的某个时候 | 有时 | 有些 | 的某个地方 |
很快 | 对不起 | 指定的 | 指定 | 指定 |
仍然 | 子 | 这样的 | 吃晚饭 | 确定 |
t | 取 | 采取 | 告诉 | 往往 |
th | 比 | 谢谢 | 谢谢 | 谢谢 |
那 | 这是 | 这是 | 的 | 他们的 |
他们的 | 他们 | 自己 | 然后 | 那里 |
在那里 | 有 | 之后 | 从而 | 因此 |
其中 | 有 | 于是 | 这些 | 他们 |
他们会 | 他们会 | 他们 | 他们已经 | 认为 |
第三 | 这 | 彻底的 | 彻底 | 那些 |
虽然 | 三个 | 通过 | 在 | 通过 |
因此 | 来 | 在一起 | 太 | 花了 |
向 | 对 | 试着 | 试 | 真正的 |
试一试 | 尝试 | 两次 | 两个 | 联合国 |
下 | 不幸的是 | 除非 | 不太可能 | 直到 |
对 | 向上 | 在 | 我们 | 使用 |
使用 | 有用的 | 使用 | 使用 | 通常 |
价值 | 各种各样的 | 非常 | 通过 | 即 |
vs | 想要 | 希望 | 是 | 不是 |
道路 | 我们 | 我们会 | 我们会 | 我们 |
我们已经 | 欢迎 | 好吧 | 去了 | 是 |
没有 | 什么 | 是什么 | 无论 | 当 |
那里 | 每当 | 在哪里 | 在哪里 | 随后 |
而 | 即 | 在 | 于是 | 无论 |
是否 | 哪一个 | 而 | 到哪里 | 谁 |
是谁 | 谁 | 整个 | 谁 | 谁的 |
为什么 | 将 | 愿意 | 希望 | 与 |
在 | 没有 | 不会 | 想知道 | 将 |
不会 | 是的 | 然而, | 你 | 你会 |
你会 | 你 | 你已经 | 你的 | 你的 |
你自己 | 你们自己 | 零 |