【求助】表A记录1万,表B记录10万,如果COUNT 更快?每次只能100个也还是很慢
数据库DB 【表A】是存放过滤关键词的表,字段 id,wd,count。目前有记录1万。
数据库DB 【表B】是存分类谷歌信息的表,字段 tid,title,content。目前有记录10万。
有一个自检功能,程序自动的获取A表的字段wd后,将统计到的表B字段content匹配的个数存放到表A的字段count中。
流程如下:
-
PHP code
<?php $queryA = DB::query("SELECT * FROM A LIMIT 100 "); while($rowA = DB::fetch($queryA)) { $id = $rowA['id']; $wd = $rowA['wd']; $count = DB::result_first("SELECT COUNT(*) FROM B WHERE `content` LIKE '%$wd%' "); DB::query("UPDATE A SET `count`='$count' WHERE id='$id' "); }
但是现在有一个问题就是查询太慢了,每次只查询A表100个还是那样。如何让查询快速?
表A,字段id 主键,自动递增。字段wd 唯一。字段count int(10)。
表B,字段tid主键,自动递增。
`content` LIKE ‘%$wd%’
这个比较难受 有索引的话也基本上很难会去走
%$wd%:无法用到索引
content id上建立索引没有
索引会占用空间,因为它需要把索引文件存在磁盘上呀。但是会加快查询速度。
关键是这个`content` LIKE ‘%$wd%’ 根本无法使用索引,也就是说,每次查询,都需要把表中的所有记录都遍历一遍。
“SELECT COUNT(*) FROM B WHERE `content` LIKE ‘%$wd%’ ” 无法利用到索引;优化下count(tid)吧
好像也没有多大的优化余地,全表扫描啊, 索引也用不上。
count 111
反过来呢,不是A表查B表,而是B表添加的时候,去更新A表。
呵呵,不太懂,随意发表一下自己的想法哈。
like “%WD%” 中的WD是不是固定值,如果是的话试一下instr函数索引。
LZ可以搜索下instr函数与like的。数据量越大,提升越明显
我在大数据量模糊查询的时候就是用的instr函数
你这自检程序就只能增加数据库的压力;一但数据量上来了,后果将会很严重。
只有从自检程序入手才能有效的解决问题。你的自检程序可以定时运行,比如每天晚上0点运行;统计前一天的数据的增加,删除情况,然后更新数量。这样比你一次like数10万的数据要快很多。
只是个建议。。。
很多时候,一个好的设计就可以减轻服务器很大的压力。
like是全文检索啊,快不了。
A表才1万条,全部加到内存中吧;然后B更新的时候更新一下A中的数据,并保持和库的同步。
一个贴吧 一个独立处理单元(可以分目录,分表,分端口,分服务器…etc)
不要老想去索引。。散列原理才靠普。
凡是巨量的数据,都必须散列…
不要指望银河计算多么多么给力,给力也是分布式运算。。还是散列原理..
优良的代码不如优良的架构.