it-swarm.com.de

Ubuntu 16.10 Überhitzungsproblem

Ich habe vor kurzem Ubuntu 16.10 installiert und seitdem startet Ubuntu von selbst neu. Die Ausgabe von: last | grep "Oct 31" ist:

aegefel  tty7         :0               Mon Oct 31 15:15    gone - no logout
reboot   system boot  4.8.0-26-generic Mon Oct 31 15:14   still running
aegefel  tty7         :0               Mon Oct 31 15:02 - down   (00:04)
reboot   system boot  4.8.0-26-generic Mon Oct 31 15:02 - 15:06  (00:04)
aegefel  tty7         :0               Mon Oct 31 14:33 - crash  (00:28)
reboot   system boot  4.8.0-26-generic Mon Oct 31 14:33 - 15:06  (00:33)
aegefel  tty7         :0               Mon Oct 31 14:12 - crash  (00:20)
reboot   system boot  4.8.0-26-generic Mon Oct 31 14:12 - 15:06  (00:54)
aegefel  tty7         :0               Mon Oct 31 13:08 - crash  (01:04)
reboot   system boot  4.8.0-26-generic Mon Oct 31 13:08 - 15:06  (01:58)

Was mich zu der Annahme führt, dass es durch einen Absturz verursacht wurde

Ich weiß nicht, woran das liegt, aber es ist passiert, als ich versucht habe, einen Film zu sehen, oder als ich ein Backup gemacht habe

Wie soll ich vorgehen?

EDIT 1

Der Befehl more /var/log/syslog* gibt mir:

Nov  6 18:18:17 aegefel-Akoya-E6424-MD99850 gnome-terminal-[2674]: Allocating size to GtkBox 0x55558d2b47b0 without calling gtk_widget_get_preferred_width/height(). How does the code know the size to allocate?
Nov  6 18:18:17 aegefel-Akoya-E6424-MD99850 gnome-terminal-[2674]: Allocating size to GtkBox 0x55558d2b47b0 without calling gtk_widget_get_preferred_width/height(). How does the code know the size to allocate?
Nov  6 18:18:31 aegefel-Akoya-E6424-MD99850 gnome-terminal-[2674]: Allocating size to GtkBox 0x55558d2b4120 without calling gtk_widget_get_preferred_width/height(). How does the code know the size to allocate?
Nov  6 18:18:31 aegefel-Akoya-E6424-MD99850 gnome-terminal-[2674]: Allocating size to GtkBox 0x55558d2b4120 without calling gtk_widget_get_preferred_width/height(). How does the code know the size to allocate?
Nov  6 18:18:36 aegefel-Akoya-E6424-MD99850 systemd[1]: Starting Stop ureadahead data collection...
Nov  6 18:18:36 aegefel-Akoya-E6424-MD99850 systemd[1]: Started Stop ureadahead data collection.

Dann passierte fast 1 Minute lang nichts. Ich nehme an, der PC wurde neu gestartet.

Der Befehl ls -alt /var/crash gibt mir für heute:

total 21672
drwxrwsrwt  2 root     whoopsie     4096 Nov  6 14:26 .
-rwxrwxrwx  1 root     whoopsie        0 Nov  6 14:26 .lock

BEARBEITEN 2

Dies wird nur angehängt, wenn meine CPU zu 40% - 50% oder mehr ausgelastet ist (Meine CPU ist ein Intel Core i5 6267U 2,9 GHz).

EDIT 3

Der Befehl sensors gibt mir Folgendes:

coretemp-isa-0000
Adapter: ISA adapter
Physical id 0:  +37.0°C  (high = +100.0°C, crit = +100.0°C)
Core 0:         +34.0°C  (high = +100.0°C, crit = +100.0°C)
Core 1:         +36.0°C  (high = +100.0°C, crit = +100.0°C)

acpitz-virtual-0
Adapter: Virtual device
temp1:        +38.0°C  (crit = +98.0°C)

pch_skylake-virtual-0
Adapter: Virtual device
temp1:        +35.0°C  

Die hohe Temperatur entspricht der kritischen. Vielleicht ist mein Laptop gerade überhitzt und der Lüfter hat keine Zeit, die Temperatur zu senken. Ich habe versucht, die hohe Temperatur zu senken, aber dies senkt automatisch die kritische (die kritische muss gleich der hohen sein)

EDIT 4

Hier hast du

Und hier sind die Abstürze vom 20. November

EDIT 5

Nach einigen Tests glaube ich, dass das Problem eine Überhitzung der GPU ist. Tatsächlich wird mein Laptop nur neu gestartet, wenn ich versuche, einen Film anzusehen, wenn ich mit einigen kostenlosen Spielen auf meinem Laptop getestet habe oder wenn ich die Unreal Engine 4 verwendet habe Standard ist die CPU (nicht die GPU). Ich habe eine Intel Iris Graphics 550 (Skylake GT3e) Idee?

4
Aegefel

Wenn Sie wirklich besorgt sind über den Neustart aufgrund von Kernel-Panics, wie der Titel Ihres Beitrags nahelegt, können Sie die Datei /etc/sysctl.conf auf eine Direktive überprüfen, die kernel.panic = n ähnelt. Dabei ist n eine Zahl, die angibt, wie viele Sekunden vor dem Neustart in einer Kernel-Panik gewartet werden muss. Untersuchungen haben ergeben, dass standardmäßig kein Neustart erforderlich ist.

Wenn Sie sich stattdessen, wie ich vermute, mehr mit der Ermittlung der Grundursache dieser Neustarts befassen (meiner Meinung nach sind einige hardwarebezogene Fehler), möchten Sie dies tun Überprüfen Sie die Maschinenprüfereignisse, um festzustellen, welche Hardware fehlerhaft funktioniert. Wenn Sie die Datei /var/log/mcelog nicht haben, müssen Sie möglicherweise das mcelog-Paket installieren, indem Sie das Universe-Repository aktivieren (falls es in Ihren Quellen nicht bereits aktiviert ist) und den Befehl Sudo apt install mcelog eingeben angemeldet bei /var/log/mcelog

Zur Verdeutlichung hier ein Auszug aus dem man mcelog

X86  CPUs  report  errors  detected  by the CPU as machine check events
       (MCEs).  These can be data corruption detected in the  CPU  caches,  in
       main memory by an integrated memory controller, data transfer errors on
       the front side bus or CPU interconnect or other internal errors.   Pos‐
       sible  causes can be cosmic radiation, instable power supplies, cooling
       problems, broken hardware, or bad luck.

       Most errors can be corrected by the CPU by  internal  error  correction
       mechanisms. Uncorrected errors cause machine check exceptions which may
       panic the machine.

Weitere Informationen zum mcelog-Dateiformat finden Sie hier

Linux-Systeme werden aufgrund von Kernel-Panik normalerweise nicht neu gestartet, sodass Sie möglicherweise die zuvor erwähnte Datei /etc/sysctl.conf überprüfen müssen.

Quellen:

http://www.techrepublic.com/blog/linux-and-open-source/auto-reboot-linux-after-a-kernel-panic/

http://packages.ubuntu.com

"mce: [Hardwarefehler]: Maschinenüberprüfungsereignisse protokolliert" wird im Syslog angezeigt. Was soll ich tun?

http://mcelog.org/logfile.html

Basierend auf Ihrem mcelog sind CPU 1 und 3 in Ihrem System überhitzt. Drosseln, Abkühlen und Wiederheraufdrosseln (all dies ist beabsichtigt, um die CPU vor Überhitzung zu schützen). Die Ursache könnte eine schlecht aufgebrachte Wärmeverbindung zwischen CPU und Kühlkörper, ein loser Kühlkörper, verstopfte Lüftungsschlitze oder übermäßig staubige oder fehlerhafte Kühlgeräte (Lüfter?) Sein. Eine andere (unwahrscheinliche) Möglichkeit ist ein Ausfall der thermischen Erkennungsfunktionen der CPU.

2
Elder Geek

Der Titel dieses Themas ist nicht klar.

Wie auch immer, wenn Sie Hilfe benötigen, um den Systemabsturz zu untersuchen, und alle vorherigen Kommentare nicht hilfreich waren, versuchen Sie Folgendes:

  1. Erhöhen Sie die Ausführlichkeit des Kernel-Protokolls.
  2. Stoppen Sie den Kernel, um ihn bei einem Absturz/einer Panik automatisch neu zu starten.
  3. Versuchen Sie, sich remote (z. B. ssh) in Ihrem System anzumelden und die Protokolle zu überprüfen.
  4. verwenden Sie, wie in @ user.dz angegeben, z. memtest86 + von http://www.memtest.org/ bis tief überprüfen Sie Ihren RAM.
  5. Weil Sie sagten " ... Dieses Anhängen nur, wenn meine CPU zu 40% - 50% oder mehr ausgelastet ist ... ", könnte ein Netzteilproblem sein? Ich meine, Ihr System benötigt mehr Strom, als das Netzteil liefern kann.
1
mattia.b89