Sziasztok!
Egy érdekes problémát szeretnék leírni, hátha találkozott más valaki ilyesmivel
vagy tudna nekem ötletet adni:
A syslog tele van "Bad page state in process" kezdetű üzenetekkel, amik után
teljesen véletlen idő elteltével a gép egyszerűen megfagy, az égvilágon semmit
sem csinál. (csak a hard reset segít, nincs benne vga, billentyűzet se). A logban
az alábbihoz hasonló bejegyzések vannak:
Sep 12 05:34:11 crok-server kernel: [25892.004862] Bad page state in process 'kswapd0'
Sep 12 05:34:11 crok-server kernel: [25892.004862] Bad page state in process 'kswapd0'
Sep 12 05:34:11 crok-server kernel: [25892.004864] page:c12d2f60 flags:0x40010008 mapping:00000000 mapcount:-4718592 count:0
Sep 12 05:34:11 crok-server kernel: [25892.004864] page:c12d2f60 flags:0x40010008 mapping:00000000 mapcount:-4718592 count:0
Sep 12 05:34:11 crok-server kernel: [25892.004885] Trying to fix it up, but a reboot is needed
Sep 12 05:34:11 crok-server kernel: [25892.004885] Trying to fix it up, but a reboot is needed
Sep 12 05:34:11 crok-server kernel: [25892.004887] Backtrace:
Sep 12 05:34:11 crok-server kernel: [25892.004887] Backtrace:
Sep 12 05:34:11 crok-server kernel: [25892.004895] Pid: 24, comm: kswapd0 Not tainted 2.6.28-15-server #49-Ubuntu
Sep 12 05:34:11 crok-server kernel: [25892.004898] Call Trace:
Sep 12 05:34:11 crok-server kernel: [25892.004910] [] ? printk+0x18/0x1a
Sep 12 05:34:11 crok-server kernel: [25892.004917] [] bad_page+0x69/0xa0
Sep 12 05:34:11 crok-server kernel: [25892.004921] [] free_hot_cold_page+0x239/0x250
Sep 12 05:34:11 crok-server kernel: [25892.004925] [] __pagevec_free+0x25/0x30
Sep 12 05:34:11 crok-server kernel: [25892.004931] [] shrink_page_list+0x25a/0x4e0
Sep 12 05:34:11 crok-server kernel: [25892.004936] [] shrink_inactive_list+0x1a1/0x4d0
Sep 12 05:34:11 crok-server kernel: [25892.004940] [] ? determine_dirtyable_memory+0x1e/0x90
Sep 12 05:34:11 crok-server kernel: [25892.004944] [] ? get_dirty_limits+0x17/0x2b0
Sep 12 05:34:11 crok-server kernel: [25892.004948] [] shrink_list+0x9f/0xb0
Sep 12 05:34:11 crok-server kernel: [25892.004952] [] shrink_zone+0xb8/0x1a0
Sep 12 05:34:11 crok-server kernel: [25892.004956] [] balance_pgdat+0x455/0x470
Sep 12 05:34:11 crok-server kernel: [25892.004961] [] ? isolate_pages_global+0x0/0x70
Sep 12 05:34:11 crok-server kernel: [25892.004967] [] ? prepare_to_wait+0x3a/0x70
Sep 12 05:34:11 crok-server kernel: [25892.004971] [] kswapd+0xc1/0x110
Sep 12 05:34:11 crok-server kernel: [25892.004974] [] ? autoremove_wake_function+0x0/0x50
Sep 12 05:34:11 crok-server kernel: [25892.004978] [] ? kswapd+0x0/0x110
Sep 12 05:34:11 crok-server kernel: [25892.004981] [] kthread+0x3c/0x70
Sep 12 05:34:11 crok-server kernel: [25892.004985] [] ? kthread+0x0/0x70
Sep 12 05:34:11 crok-server kernel: [25892.004990] [] kernel_thread_helper+0x7/0x10
Kérdésem, hogy találkozott-e valaki ilyennel? Van ötlet, hogy mi csinálhatja?
RAM már tesztelt, memtest egyetlen hibát sem írt.
Kérek mindenkit, hogy ha lehet a Google első 35 oldalából ne is válogasson,
megvolt, nem vagyok előrébb.. NIC csere is volt, nem melegszik, swap partíció
helyett már file is volt használva. Tapasztalati ötletekre lenne szükségem.
Kernel: 2.6.28-15-server, de mindegyik eddig használttal baj volt (desktop is).
A vas egy Gigabyte GA-7VA alapon AMD Sempron 3000+, 512MB RAM.
[szerk.]
Újabb kerneleket is kipróbáltam, a mainline vonalról:
- 2.6.31-020631-generic
- 2.6.30-020630-generic
Semmi változás, olyan 24..27 óra után hibaüzenet aztán egyszercsak system locked up.
hwinfo: http://pastebin.com/f73add002
lspci: http://pastebin.com/f295f5cef