2017/10/26

犯人はこの中にいる!

Oct 25 12:55:17 debian kernel: [49542.112087] INFO: task apache2:18885 blocked for more than 120 seconds.
Oct 25 12:55:17 debian kernel: [49542.112100] Not tainted 4.9.0-4-amd64 #1 Debian 4.9.51-1
Oct 25 12:55:17 debian kernel: [49542.112108] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Oct 25 12:55:17 debian kernel: [49542.112118] apache2 D 0 18885 1517 0x20020000
Oct 25 12:55:17 debian kernel: [49542.112121] ffff96fbf7bdfc00 0000000000000000 ffff96fbfbba00c0 ffff96fbfc618240
Oct 25 12:55:17 debian kernel: [49542.112122] ffffffff9120e500 ffffb7cf85597888 ffffffff90c038e3 ffff96fbfbb66c00
Oct 25 12:55:17 debian kernel: [49542.112123] 00ffffff906a9865 ffff96fbfc618240 ffff96fbf80d3140 ffff96fbfbba00c0
Oct 25 12:55:17 debian kernel: [49542.112125] Call Trace:
Oct 25 12:55:17 debian kernel: [49542.112128] [] ? __schedule+0x233/0x6d0
Oct 25 12:55:17 debian kernel: [49542.112130] [] ? schedule+0x32/0x80
Oct 25 12:55:17 debian kernel: [49542.112131] [] ? schedule_preempt_disabled+0xa/0x10
Oct 25 12:55:17 debian kernel: [49542.112132] [] ? __mutex_lock_slowpath+0xb4/0x130
Oct 25 12:55:17 debian kernel: [49542.112134] [] ? mutex_lock+0x1b/0x30
Oct 25 12:55:17 debian kernel: [49542.112146] [] ? cifs_reconnect_tcon+0x8f/0x320 [cifs]
Oct 25 12:55:17 debian kernel: [49542.112152] [] ? smb_init+0x27/0x80 [cifs]
Oct 25 12:55:17 debian kernel: [49542.112158] [] ? CIFSSMBQPathInfo+0x66/0x310 [cifs]
Oct 25 12:55:17 debian kernel: [49542.112166] [] ? cifs_query_path_info+0x6c/0x180 [cifs]
Oct 25 12:55:17 debian kernel: [49542.112167] [] ? schedule_hrtimeout_range_clock+0xc5/0x1a0
Oct 25 12:55:17 debian kernel: [49542.112168] [] ? list_del+0x9/0x30
Oct 25 12:55:17 debian kernel: [49542.112169] [] ? remove_wait_queue+0x20/0x30
Oct 25 12:55:17 debian kernel: [49542.112170] [] ? poll_freewait+0x45/0xa0
Oct 25 12:55:17 debian kernel: [49542.112177] [] ? cifs_get_inode_info+0x402/0x920 [cifs]
Oct 25 12:55:17 debian kernel: [49542.112184] [] ? build_path_from_dentry+0xeb/0x3f0 [cifs]
Oct 25 12:55:17 debian kernel: [49542.112190] [] ? build_path_from_dentry+0x15e/0x3f0 [cifs]
Oct 25 12:55:17 debian kernel: [49542.112197] [] ? cifs_revalidate_dentry_attr+0x1d3/0x250 [cifs]
Oct 25 12:55:17 debian kernel: [49542.112203] [] ? cifs_revalidate_dentry+0xf/0x20 [cifs]
Oct 25 12:55:17 debian kernel: [49542.112209] [] ? cifs_d_revalidate+0x1e/0xa0 [cifs]
Oct 25 12:55:17 debian kernel: [49542.112211] [] ? lookup_fast+0x2bd/0x2e0
Oct 25 12:55:17 debian kernel: [49542.112212] [] ? walk_component+0x44/0x320
Oct 25 12:55:17 debian kernel: [49542.112213] [] ? path_lookupat+0x67/0x120
Oct 25 12:55:17 debian kernel: [49542.112214] [] ? filename_lookup+0xb1/0x180
Oct 25 12:55:17 debian kernel: [49542.112215] [] ? inet_recvmsg+0x7d/0xb0
Oct 25 12:55:17 debian kernel: [49542.112216] [] ? __check_object_size+0xfa/0x1d8
Oct 25 12:55:17 debian kernel: [49542.112218] [] ? strncpy_from_user+0x48/0x160
Oct 25 12:55:17 debian kernel: [49542.112219] [] ? vfs_fstatat+0x59/0xb0
Oct 25 12:55:17 debian kernel: [49542.112220] [] ? sys32_stat64+0x25/0x60
Oct 25 12:55:17 debian kernel: [49542.112221] [] ? do_gettimeofday+0x25/0x90
Oct 25 12:55:17 debian kernel: [49542.112223] [] ? compat_SyS_gettimeofday+0x39/0x90
Oct 25 12:55:17 debian kernel: [49542.112224] [] ? do_fast_syscall_32+0x8d/0x170
Oct 25 12:55:17 debian kernel: [49542.112225] [] ? entry_SYSENTER_compat+0x4c/0x5b

というわけで、apacheがいかんのかと思っていたら、cifsじゃね?ということで。

いや、最近よく鯖が固まるんです。
認証かけているところだけだったのでssl絡みかapache周りだとずっと思っていたのですが・・・
鯖はHyper-V上で動いていて、バックアップを取るために一日一回サスペンドに入るのですが、そこから復帰したときにcifsが固まるせいでそこへアクセスしようとするapacheが固まる、という事だった様子。

ということでgoogle先生に聞いたらやっぱり同じ症状の人がいました。
SMB/CIFS mount hang and kernel hung task
Bug#861104: linux-image-4.9.0-2-amd64: Kernel deadlock with CIFS mounts
が、どうしたらよいという解決策は微妙で、1つ目のリンクのようにアクセスし続ける、というのも手なのかも。

ひとまず、autofsで
/mnt/samba /etc/auto.master.d/windows.cnf -t=0 -g
としているのを-t=600に変えて都度マウントするようにしてみましょう。

→なんとなく治った気がします。
-t=0の実装が良くないのか、windows側の問題かはわかりませんが、正常にレジュームできないんでしょうね。

0 件のコメント:

コメントを投稿