表A记录1万,表B记录10万,如果COUNT 更快?每次只能100个也还是很慢

【求助】表A记录1万,表B记录10万,如果COUNT 更快?每次只能100个也还是很慢

数据库DB 【表A】是存放过滤关键词的表,字段 id,wd,count。目前有记录1万。

数据库DB 【表B】是存分类谷歌信息的表,字段 tid,title,content。目前有记录10万。

有一个自检功能,程序自动的获取A表的字段wd后,将统计到的表B字段content匹配的个数存放到表A的字段count中。

流程如下:

PHP code


  
<?php

$queryA = DB::query("SELECT * FROM A LIMIT 100 ");
while($rowA = DB::fetch($queryA))
{
  $id = $rowA['id'];
  $wd = $rowA['wd'];
  $count = DB::result_first("SELECT COUNT(*) FROM B WHERE `content` LIKE '%$wd%' ");
  DB::query("UPDATE A SET `count`='$count' WHERE id='$id' ");
}



但是现在有一个问题就是查询太慢了,每次只查询A表100个还是那样。如何让查询快速?

表A,字段id 主键,自动递增。字段wd 唯一。字段count int(10)。

表B,字段tid主键,自动递增。




`content` LIKE ‘%$wd%’

这个比较难受 有索引的话也基本上很难会去走




%$wd%:无法用到索引

content id上建立索引没有




索引会占用空间,因为它需要把索引文件存在磁盘上呀。但是会加快查询速度。




关键是这个`content` LIKE ‘%$wd%’ 根本无法使用索引,也就是说,每次查询,都需要把表中的所有记录都遍历一遍。




“SELECT COUNT(*) FROM B WHERE `content` LIKE ‘%$wd%’ ” 无法利用到索引;优化下count(tid)吧




好像也没有多大的优化余地,全表扫描啊, 索引也用不上。



count 111




反过来呢,不是A表查B表,而是B表添加的时候,去更新A表。

呵呵,不太懂,随意发表一下自己的想法哈。




like “%WD%” 中的WD是不是固定值,如果是的话试一下instr函数索引。




LZ可以搜索下instr函数与like的。数据量越大,提升越明显

我在大数据量模糊查询的时候就是用的instr函数




你这自检程序就只能增加数据库的压力;一但数据量上来了,后果将会很严重。

只有从自检程序入手才能有效的解决问题。你的自检程序可以定时运行,比如每天晚上0点运行;统计前一天的数据的增加,删除情况,然后更新数量。这样比你一次like数10万的数据要快很多。

只是个建议。。。

很多时候,一个好的设计就可以减轻服务器很大的压力。




like是全文检索啊,快不了。




A表才1万条,全部加到内存中吧;然后B更新的时候更新一下A中的数据,并保持和库的同步。




一个贴吧 一个独立处理单元(可以分目录,分表,分端口,分服务器…etc)

不要老想去索引。。散列原理才靠普。

凡是巨量的数据,都必须散列…

不要指望银河计算多么多么给力,给力也是分布式运算。。还是散列原理..

优良的代码不如优良的架构.

表A记录1万,表B记录10万,如果COUNT 更快?每次只能100个也还是很慢

相关文章:

你感兴趣的文章:

标签云: