183 搜狐中电云集

squid故障汇总

1、COSS will not function without large file support (off_t is 4 bytes long. Please reconsider recompiling squid with –with-large-files

Bungled squid_webcache.conf 。。。。。。。

检查是否在编译squid的时候未加入 –with-large-files 选项，如果是，重新加入此选项再编译一次squid

2、使用coss缓存格式的时候，squid不断重建cache

可能原因为maxfullbufs值过低，去掉maxfullbufs限制，让其值为无限

3、日志中有类似如下的内容：

2007/03/05 14:46:56| Ready to serve requests.

2007/03/05 14:46:59| clientReadRequest: FD 11 (192.168.1.5:34061) Invalid Request

Illegal character in hostname; underscores are not allowed

注释：无效的字符串，访问地址中不允许下划线。

解决办法：

squid 2.5 中，编译的时候加入如下参数

–enable-underscore

允许解析的URL中出现下划线，因为默认squid会认为带下划线的URL地址是非法的，并拒绝访问该地址。

对于 2.6 版本，编译时没有这个参数，这个参数出现在 squid.conf 的配置文档里，说明是这样的：

allow_underscore New option to allow _ in hostnames, replacing the similar build time configure option in 2.5 and earlier.

具体的在 squid.conf 中的参数，可以在配置文档里搜索一下 allow_underscore，看一下配置文档的具体注释。

4、squid的cache.log日志中又类似如下的警告：

WARNING: 100 swapin MD5 mismatches

这个错误是说squid读入一个缓存文件的时候，存储在接口对应的位置的URL不是

squid认为应该存储在那里的数据。这可能是swap.state有错误或文件指到了磁盘

上错误的块（文件系统有错误）。

停止squid应用，删除swap.state然后启动squid，让它通过读取缓存文件来重建缓存

记录，如果重建后仍然出现上面的情况，那应该就是文件系统或磁盘有问题了。

5、日志中出现下面警告：

Jun 28 11:14:38 localhost squid[27178]: squidaio_queue_request: Syncing pending I/O operations.. (blocking)

Jun 28 11:14:59 localhost squid[27178]: squidaio_queue_request: Synced

Jun 28 11:14:59 localhost squid[27178]: storeAufsOpenDone: (2) No such file or directory

Jun 28 11:14:59 localhost squid[27178]: /data/squid/cache_webcache1/00/6B/00006B29

Jun 28 11:14:59 localhost squid[27178]: storeAufsOpenDone: (2) No such file or directory

Jun 28 11:14:59 localhost squid[27178]: /data/squid/cache_webcache1/00/DC/0000DC36

Jun 28 11:14:59 localhost squid[27178]: WARNING: 1 swapin MD5 mismatches

Jun 28 11:14:59 localhost squid[27178]: WARNING: Disk space over limit: 18925740 KB > 16777216 KB

Jun 28 11:14:59 localhost squid[27178]: storeAufsOpenDone: (2) No such file or directory

Jun 28 11:14:59 localhost squid[27178]: /data/squid/cache_webcache2/00/92/0000924F

Jun 28 11:14:59 localhost squid[27178]: storeAufsOpenDone: (2) No such file or directory

Jun 28 11:14:59 localhost squid[27178]: /data/squid/cache_webcache1/03/6F/00036FB6

Jun 28 11:14:59 localhost squid[27178]: squidaio_queue_request: Async request queue growing uncontrollably!

解决方法：

检查配置文件，cache设置为aufs文件系统格式，将此设置改为ufs，重建cache缓存目录

6、运行reconfigure的时候出现squid: ERROR: no running copy

原因是找不到pid文件，如果不是使用默认的squid.conf作为squid的设置文件，在用squid目录下sbin/squid进行重新启动等动作的时候要加上-f的参数制定配置文件，同时检查pid文件是否存在，有时候可能错误地配置了pid文件到不存在的目录，或者将pid文件配置到了应用没有权限写入的目录，导致没有创建pid文件，如果pid文件不存在，可以手工创建该pid，然后获取squid的pid并写人pid文件。

7、squid在压力大的情况下响应非常慢

检查是否文件描述符太小，如果是，调整文件描述符限制，重启squid，检查squid运行的文件描述符，如果为调整后的，则在启动脚本处启动squid的地方加入调整文件描述符的命令，否则除此外还需先调整文件描述符限制然后重新编译安装一次squid

8、缓存效率下降，查看日志无报错，netstat -na查看连接有比较多的连接为SYN_RE，且多为同一IP过来的连接

优化TCP网络

echo 1 > /proc/sys/net/ipv4/tcp_syncookies

echo 1 > /proc/sys/net/ipv4/tcp_synack_retries

echo 1 > /proc/sys/net/ipv4/tcp_syn_retries

9、缓存效率低，网卡输入输出流量差距很小。

首先查看系统日志有无squid的报错，如果没有再查看dmesg，看看有无丢包，是否网卡问题，如果没有再查看网关

使用squid的时候网关问题关系重大，如果网关没有配置正确，将可能导致用户访问不了。

10、日志报如下错误：squid: Could not determine fully qualified hostname. Please set ‘visible_hostname’

检查/etc/hosts文件、/etc/sysconfig/network文件、和hostname命令结果，看看三者是否对应，如果不对应，需要修改为对应，并且/etc/hosts文件中对应的配置还需要有合法域名格式

/etc/sysconfig/network中的hostname是系统启动时候加载的hostname值，如果此值与/etc/hosts文件中的值不对应并且squid中没有设置visible_hostname选项的话，会导致系统重启后squid不能正常启动。

11、日志大量报如下错误：

Apr 29 08:28:56 localhost squid[13851]: httpReadReply: Excess data from “HEAD https://192.168.230.1/”

这表明服务器返回一个超过squid声明的响应对象最大值的返回值。

它违反了HTTP协议并导致服务器返回被截断。

12.runcache发现频繁重启后停止服务:

:./bin/RunCache Running: squid -sY >> /usr/local/squid//var/squid.out 2>&1

./bin/RunCache: line 35: 20000 File size limit exceededsquid -NsY $conf >>$logdir/squid.out 2>&1

./bin/RunCache: line 35: 20177 File size limit exceededsquid -NsY $conf >>$logdir/squid.out 2>&1

RunCache: EXITING DUE TO REPEATED, FREQUENT FAILURES

故障原因: log超过了ext3文件系统最大支持容量2G导致,解决办法:

1)每天轮循一次日志0 0 * * * /usr/local/squid/sbin/squid -k rotate

转自：https://hi.baidu.com/ncache/blog/item/661914102839c176cb80c444.html

以下为个人总结

一：报错信息：

FATAL: Failed to verify one of the swap directories, Check cache.log

for details. Run ’squid -z’ to create swap directories

if needed, or if running Squid for the first time.

Squid Cache (Version 2.6.STABLE18): Terminated abnormally.

未执行squid -z命令需要执行该命令初始化cache目录，假如想观察这个过程 squid -zX

Creating Swap Directories

FATAL: Failed to make swap directory /usr/local/squid/var/cache/00:

(13) Permission denied

确认/usr/local/squid/var/cache目录的所有组成都可被squid.conf给定的用户ID访问

二：

WARNING:squidaio_queue_request: WARNING - Queue congestion

IO的队列满了, ,重谝一下源代码,加大IO的队列或换一种IO方式。

编译时：–enable-async-io=40 （我的是40，少了）

三：

helperOpenServers: Starting 5 ‘dnsserver’ processes

ipcCreate: fork: (12) Cannot allocate memory

WARNING: Cannot run ‘/opt/squid/libexec/dnsserver’ process.

系统内存被耗光，没有内存分配给squid的dns进程

四：

FATAL: xcalloc: Unable to allocate 1 blocks of 4108 bytes!

Squid 开启大内存导致进程内存溢出

五：

cache.log

2009/08/27 20:49:55| HTCP Disabled.

2009/08/27 20:49:55| sendto FD 17: (1) Operation not permitted

2009/08/27 20:49:55| ipcCreate: CHILD: hello write test failed

????

cu的朋友总结是configure时编译了–enable-icmp参数，去掉即可。

六：文件系统的问题导致squid异常down机？

我有两台squid做负载，IP分别为1.1，1.2.但最近发现1.2这台squid总异常死掉，并且看日志也看不出什么情况，是assertion failed: diskd/store_io_diskd.c:384: “!diskdstate->flags.close_request”

很是郁闷。。。今天执行ps fax操作时突然发现：

1.2上显示：

21248 ? Sl 6:06 /opt/squid/sbin/squid -N

21369 ? Ss 0:00 \_ (unlinkd)

21410 ? Ss 0:02 \_ diskd 21757956 21757957 21757958

21653 ? Ss 0:00 \_ (dnsserver)

21654 ? Ss 0:00 \_ (dnsserver)

21655 ? Ss 0:00 \_ (dnsserver)

21410这个进程是什么东西？

查看另一台1.1：

3067 ? Sl 152:49 /opt/squid/sbin/squid -N

3858 ? Ss 0:00 \_ (unlinkd)

6435 ? Ss 0:06 \_ (dnsserver)

6436 ? Ss 0:04 \_ (dnsserver)

6437 ? Ss 0:03 \_ (dnsserver)

没有diskd这个东西，所以它没有频繁down机。

难道真是这个原因？？

在网上查了一些资料，发现这个问题，以下摘自网络民工的blog：https://hi.baidu.com/chgel/blog/item/6f22552f3a28fa3d1f3089e0.html

diskd

diskd（disk 守护进程的短称）类似于aufs，磁盘I/O 被外部进程来执行。不同于aufs 的是，diskd 不使用线程。代替的，它通过消息队列和共享内存来实现内部进程间通信。

Squid 对每个cache_dir 创建一个diskd 进程。这不同于aufs，aufs 对所有的cache_dir 使用一个大的线程池。对每个I/O 操作， squid 发送消息到相应的diskd 进程。当该操作完成后，diskd 进程返回一个状态消息给squid。squid和diskd 进程维护队列里的消息的顺序。这样，不必担心I/O 会无序执行。对读和写操作，squid 和diskd 进程使用共享内存区域。两个进程能对同一内存区域进行读和写。例如，当squid 产生读请求时，它告诉diskd 进程在内存中何处放置数据。diskd 将内存位置传递给read()系统调用，并且通过发送队列消息，通知squid 该过程完成了。然后squid 从共享内存区域访问最近的可读数据。diskd 与aufs 本质上都支持squid 的无阻塞磁盘I/O。当diskd 进程在I/O 操作上阻塞时，squid 有空去处理其他任务。在diskd 进程能跟上负载情况下，这点确实工作良好。因为 squid 主进程现在能够去做更多工作，当然它有可能会加大diskd 的负载。diskd 有两个功能来帮助解决这个问题。

首先，squid 等待diskd 进程捕获是否队列超出了某种极限。默认值是64 个排队消息。假如diskd 进程获取的数值远大于此，squid 会休眠片刻，并等待 diskd完成一些未决操作。这本质上让squid 进入阻塞I/O 模式。它也让更多的CPU时间对diskd 进程可用。通过指定cache_dir 行的 Q2 参数的值，你可以配置这个极限值：

cache_dir diskd /var/spool/squid 10240 16 256 Q2=50

第二，假如排队操作的数量抵达了另一个极限，squid 会停止要求diskd 进程打开文件。这里的默认值是72 个消息。假如squid 想打开一个磁盘文件读或写，但选中的cache_dir 有太多的未完成操作，那么打开请求会失败。当打开文件读时，会导致cache 丢失。当打开文件写时，会阻碍squid 存储cache 响应。这两种情况下用户仍能接受到有效响应。唯一实际的影响是squid 的命中率下降。这个极限用Q1 参数来配置：

cache_dir diskd /var/spool/squid 10240 16 256 Q1=60 Q2=50

注意在某些版本的squid 中，Q1 和Q2 参数混杂在默认的配置文件里。最佳选择是，Q1 应该大于Q2。

查看两台配置的cache_dir，果然发现了这个区别。这样基本就明白了，应该是文件系统不同的原因，由于diskd进程获取的数值远大于64，导致squid休眠。

现在怀疑到是这里，更改过来之后再观察情况。

重新查到一些资料，如果要使用diskd文件系统的话，应该做一些内核的调整：

在Linux上配置消息队列，增加下列行到/etc/sysctl.conf：

kernel.msgmnb=8192

kernel.msgmni=40

kernel.msgmax=8192

kernel.shmall=2097152

kernel.shmmni=32

kernel.shmmax=16777216

以下是对上面参数的一些解释：

diskd看起来是可移植的，既然共享内存和消息队列在现代Unix系统上被广泛支持。然而，你可能需要调整与这两者相关的内核限制。内核典型的有如下可用参数：

MSGMNB

每个消息队列的最大字节限制。对diskd的实际限制是每个队列大约100个排队消息。squid传送的消息是32－40字节，依赖于你的CPU体系。这样，MSGMNB应该是4000或更多。为安全起见，我推荐设置到8192。

MSGMNI

整个系统的最大数量的消息队列。squid对每个cache_dir使用两个队列。假如你有10个磁盘，那就有20个队列。你也许该增加更多，因为其他应用程序也要使用消息队列。我推荐的值是40。

MSGGSZ

消息片断的大小（字节）。大于该值的消息被分割成多个片断。我通常将这个值设为64，以使diskd消息不被分割成多个片断。

MSGSEG

在单个队列里能存在的最大数量的消息片断。squid正常情况下，限制队列的长度为100个排队消息。记住，在64位系统中，假如你没有增加MSGSSZ的值到64，那么每个消息就会被分割成不止1个片断。为了安全起见，我推荐设置该值到512。

MSGTQL

整个系统的最大数量的消息。至少是cache_dir数量的100倍。在10个cache目录情况下，我推荐设置到2048。

MSGMAX

单个消息的最大size。对Squid来说，64字节足够了。然而，你系统中的其他应用程序可能要用到更大的消息。在某些操作系统例如BSD中，你不必设置这个。BSD自动设置它为MSGSSZ * MSGSEG。其他操作系统中，你也许需要改变这个参数的默认值，你可以设置它与MSGMNB相同。

SHMSEG

每个进程的最大数量的共享内存片断。squid对每个cache_dir使用1个共享内存标签。我推荐设置到16或更高。

SHMMNI

共享内存片断数量的系统级的限制。大多数情况下，值为40足够了。

SHMMAX

单个共享内存片断的最大size。默认的，squid对每个片断使用大约409600字节。

为安全起见，我推荐设置到2MB，或2097152。

SHMALL

可分配的共享内存数量的系统级限制。在某些系统上，SHMALL可能表示成页数量，而不是字节数量。在10个cache_dir的系统上，设置该值到16MB（4096页）足够了，并有足够的保留给其他应用程序

文章出处：https://www.diybl.com/course/6_system/linux/Linuxjs/2007921/72568_3.html

这样看来我的squid应该就是因为使用了diskd文件系统且没有做任何调整导致的了..

日志中出现下面警告：

2009/08/03 16:29:44| storeAufsOpenDone: (2) No such file or directory

2009/08/03 16:29:44| /opt/squid/cache/08/0B/0002E176

2009/08/03 16:29:44| storeAufsOpenDone: (2) No such file or directory

2009/08/03 16:29:44| /opt/squid/cache/08/0D/0002E1BB

2009/08/03 16:29:44| storeAufsOpenDone: (2) No such file or directory

2009/08/03 16:29:44| /opt/squid/cache/0F/0D/00083DB7

2009/08/03 16:29:44| storeAufsOpenDone: (2) No such file or directory

2009/08/03 16:29:44| /opt/squid/cache/05/15/000A56AD

解决方法：

检查配置文件，cache设置为aufs文件系统格式，将此设置改为ufs，重建cache缓存目录，这时我的是diskd，所以更改为afus，解决

最后更新：2017-01-04 22:34:32

squid故障汇总

上一篇：网站CDN获取真实IP解决方案

下一篇： crontab精确到以秒为单位

相关内容

热门内容

最新内容

squid故障汇总

上一篇： 网站CDN获取真实IP解决方案

下一篇： crontab精确到以秒为单位

相关内容

热门内容

最新内容

上一篇：网站CDN获取真实IP解决方案