Freitag, 12. März 2010, 02:01 UTC+1

Sie sind nicht angemeldet.

  • Anmelden
  • Registrieren

silberzwiebel

Anfänger

Beiträge: 7

Distribution: Ubuntu

Version: 9.10

Architektur: 64-Bit PC

Desktop: GNOME

1

Sonntag, 7. Februar 2010, 15:02

Interne Festplatte hängt sich automatisch aus

Hallo Ubuntuforum!

Ich habe folgendes Problem, dass ich einfach nicht lösen kann:

Habe ein Dualboot-System mit Win7 und Ubuntu 9.10, die beide auf einer IDE-Festplatte liegen.
Dazu habe ich eine SATA-Daten-Platte, die als ntfs formatiert ist. Und die macht leider folgendes Problem: Sie hängt sich automatisch im laufenden Betrieb aus. Wenn das passiert findet z.B. Thunderbird die Emails nicht und Rhythmbox die Musik nicht mehr.

Durch einen Eintrag in /etc/fstab wird die Platte beim Start gemounet:

Quellcode

1
UUID=22862F5E32B3717A /media/dateien ntfs defaults 0 0

interessant ist, dass beim automatischen aushängen die Fetsplatte die Gerätedatei wechselt. will heißen: Sie ist am Anfang /dev/sda, nach dem Aushängen gibts die Datei nicht mehr, dafür aber /dev/sdc
das passiert teilweise auch schon vorm einhängen, sodass mein fstab-Eintrag (als er noch nicht mit UUID war, sondern mit /dev/sda1) teilweise die falsche Platte gemountet hat (nämlich die win7-Platte).
so ein Aushängen kündigt sich meistens durch ein Piepen aus dem PC an, zu dem folgende Meldungen in den Logdateien korrespondieren:

Quellcode

1
2
3
4
Feb  7 14:07:33 thomas-desktop kernel: [ 8102.753080] ata3: hard resetting link
Feb  7 14:07:37 thomas-desktop kernel: [ 8106.624086] ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
Feb  7 14:07:37 thomas-desktop kernel: [ 8106.632800] ata3.00: configured for UDMA/133
Feb  7 14:07:37 thomas-desktop kernel: [ 8106.632808] ata3: EH complete

Nach einem Aushängen kann ich auch nicht mehr auf /media/dateien zugreifen, erst nachdem ich

Quellcode

1
sudo umount /dev/sda1

eingebe. dann kann ich auch, die neu erschiene platte wieder problemlos einhängen.

SMART meldet keine Fehler.

Habe schon ein anderes SATA-Kabel sowie einen anderen Steckplatz ausprobiert, das Problem besteht leider weiterhin :(

Habe schon bei ubuntuusers.de mein Glück probiert, aber da hat mir auch keiner weiterhelfen können. Hier der Link zum Thread (mit noch weiterführenden informationen): http://forum.ubuntuusers.de/topic/intern…autmatisch-aus/

Hoffe jemand von Euch hat eine Idee??

Gruß, silberzwiebel

2

Sonntag, 7. Februar 2010, 16:18

Hi,
Was sagt denn eigentlich "smartctl -a" über die Platte?
Und was ist das für ein Controller? -> aus "lspci -vnn" den Block über den SATA Controller posten, bitte.
Grüße!
  Das Geheimnis des Linux-Kernels   Support-Anfragen per PN sind der kürzeste Weg in die Ignorierliste   "Bin Anfänger" ist keine Ausrede

silberzwiebel

Anfänger

Beiträge: 7

Distribution: Ubuntu

Version: 9.10

Architektur: 64-Bit PC

Desktop: GNOME

3

Sonntag, 7. Februar 2010, 16:33

smartctl -a:

Quellcode

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
smartctl version 5.38 [x86_64-unknown-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model: 	ST3500418AS
Serial Number:	9VM7S5YN
Firmware Version: CC38
User Capacity:	500.107.862.016 bytes
Device is:    	Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:	Sun Feb  7 16:28:39 2010 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x82)	Offline data collection activity
					was completed without error.
					Auto Offline Data Collection: Enabled.
Self-test execution status:  	(   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		 ( 600) seconds.
Offline data collection
capabilities: 			 (0x7b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:        	(0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:    	(0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 (  86) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.
SCT capabilities: 	   	(0x103f)	SCT Status supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME      	FLAG 	VALUE WORST THRESH TYPE  	UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 	0x000f   117   099   006	Pre-fail  Always   	-   	119869401
  3 Spin_Up_Time        	0x0003   099   097   000	Pre-fail  Always   	-   	0
  4 Start_Stop_Count    	0x0032   100   100   020	Old_age   Always   	-   	391
  5 Reallocated_Sector_Ct   0x0033   100   100   036	Pre-fail  Always   	-   	0
  7 Seek_Error_Rate     	0x000f   062   060   030	Pre-fail  Always   	-   	1774879
  9 Power_On_Hours      	0x0032   100   100   000	Old_age   Always   	-   	164
 10 Spin_Retry_Count    	0x0013   100   100   097	Pre-fail  Always   	-   	0
 12 Power_Cycle_Count   	0x0032   100   100   020	Old_age   Always   	-   	194
183 Unknown_Attribute   	0x0032   098   098   000	Old_age   Always   	-   	2
184 Unknown_Attribute   	0x0032   100   100   099	Old_age   Always   	-   	0
187 Reported_Uncorrect  	0x0032   100   100   000	Old_age   Always   	-   	0
188 Unknown_Attribute   	0x0032   100   100   000	Old_age   Always   	-   	0
189 High_Fly_Writes     	0x003a   100   100   000	Old_age   Always   	-   	0
190 Airflow_Temperature_Cel 0x0022   064   060   045	Old_age   Always   	-   	36 (Lifetime Min/Max 35/36)
194 Temperature_Celsius 	0x0022   036   040   000	Old_age   Always   	-   	36 (0 12 0 0)
195 Hardware_ECC_Recovered  0x001a   038   021   000	Old_age   Always   	-   	119869401
197 Current_Pending_Sector  0x0012   100   100   000	Old_age   Always   	-   	0
198 Offline_Uncorrectable   0x0010   100   100   000	Old_age   Offline  	-   	0
199 UDMA_CRC_Error_Count	0x003e   200   200   000	Old_age   Always   	-   	0
240 Head_Flying_Hours   	0x0000   100   253   000	Old_age   Offline  	-   	63964947939908
241 Unknown_Attribute   	0x0000   100   253   000	Old_age   Offline  	-   	4198418278
242 Unknown_Attribute   	0x0000   100   253   000	Old_age   Offline  	-   	270144333

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description	Status              	Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline   	Completed without error   	00%   	162     	-
# 2  Extended offline	Completed without error   	00%   	145     	-
# 3  Short offline   	Completed without error   	00%   	144     	-
# 4  Short offline   	Interrupted (host reset)  	00%   	144     	-
# 5  Short offline   	Interrupted (host reset)  	00%   	144     	-
# 6  Short offline   	Completed without error   	00%   	135     	-
# 7  Short offline   	Completed without error   	00%   	134     	-
# 8  Extended offline	Completed without error   	00%   	128     	-
# 9  Extended offline	Completed without error   	00%     	3     	-
#10  Short offline   	Completed without error   	00%     	0     	-

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
	1    	0    	0  Not_testing
	2    	0    	0  Not_testing
	3    	0    	0  Not_testing
	4    	0    	0  Not_testing
	5    	0    	0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.


Die self-test mit "Interrupted" hatten eines dieser Piepen während des Testens.

SATA-Controller:

Quellcode

1
2
3
4
5
6
7
8
9
10
11
12
00:11.0 SATA controller [0106]: ATI Technologies Inc SB700/SB800 SATA Controller [AHCI mode] [1002:4391] (prog-if 01)
	Subsystem: Micro-Star International Co., Ltd. Device [1462:7596]
	Flags: bus master, 66MHz, medium devsel, latency 64, IRQ 22
	I/O ports at c000 [size=8]
	I/O ports at b000 [size=4]
	I/O ports at a000 [size=8]
	I/O ports at 9000 [size=4]
	I/O ports at 8000 [size=16]
	Memory at f9fffc00 (32-bit, non-prefetchable) [size=1K]
	Capabilities: [60] Power Management version 2
	Capabilities: [70] SATA HBA <?>
	Kernel driver in use: ahci

4

Sonntag, 7. Februar 2010, 17:11

Hi,
Könnte evtl. mit diesem Bug verwandt sein, obwohl dein Controller ein neuerer zu sein scheint.
Aber da Du schreibst, daß es erst seit kurzem auftritt und nicht immer schon da war. Der Bug kommt und geht auch mit den Kernel-Versionen.
Als Alternative könnte ich Dir noch den Firmware-Serienfehler der 7200.10er- Seagates anbieten. Keiner weiß, ob die .12er viel besser sind. Ich denke, da wäre Dir die erste Variante sympatischer. ;)
Grüße!
  Das Geheimnis des Linux-Kernels   Support-Anfragen per PN sind der kürzeste Weg in die Ignorierliste   "Bin Anfänger" ist keine Ausrede

silberzwiebel

Anfänger

Beiträge: 7

Distribution: Ubuntu

Version: 9.10

Architektur: 64-Bit PC

Desktop: GNOME

5

Sonntag, 7. Februar 2010, 17:56

hmm.

Der Bug, den Du verlinkt hast scheint nur unter "heavy data transfer" zu geschehen. Bei mir passiert das aber auch einfach so. Teilweise schon bevor überhaupt komplett gebootet ist. Außerdem hab ich noch nie einen softreset bei mir im log gesehen. Weiß also nicht so recht, ob das was damit zu tun hat. Das problem tritt zwar erst seit kurzem auf, ich hab die Platte aber auch erst seit kurzem ;) Hatte vorher eine baugleiche, wo ich meine beiden BS draufgepackt hatte, die dann regelmäßig abgestürzt sind. Da hatte SMART aber auch eindeutig Fehler gemeldet, so dass ich die Platte umgetauscht hab.
Was die Firmware angeht: Zur 12er Serie habe ich nichts finden können. Zur 11er Serie gibt es aber wohl ein Firmware-Update. Die Firmware-Probleme mit der 11er Serie haben wohl aber auch die Platten komplett unbenutzbar gemacht. Was bei mir ja auch nicht der Fall ist.
Naja, vielleicht liegts ja doch irgendwie an einem dieser beiden Probleme. Was meins aber leider nicht löst :(
Aber trotzdem Danke für Hilfe!
Falls jemand noch andere Ideen hat, immer her damit ;)
Werde wohl in Zukunft die Finger von Seagate lassen.

Interessant ist auch, dass dieses automatische Aushängen bisher immer maximal einmal pro Sitzung passiert ist.

Gruß,
silberzwiebel

6

Sonntag, 7. Februar 2010, 18:29

Außerdem hab ich noch nie einen softreset bei mir im log gesehen
Bei Dir kommt immer gleich der hard reset. Den hatte der Bugreporter auch, nachdem der softreset fehlschlug. Der hatte das Problem aber auch mit einer Samsung-Platte.
Dein Treiber versucht jedenfalls zusätzlich noch, auf SATA150-Modus zurückzuschalten. Man kann es also nicht leicht zuordnen: Merkt der Controller Probleme mit der Platte und der Treiber versucht das zu bessern oder hat der Treiber Probleme mit dem Controller (oder einen Bug)?
ich hab die Platte aber auch erst seit kurzem
Daraus schließe ich jetzt, daß dieses Problem mit dieser Platte immer schon da war, jedoch mit der vorigen nicht in der gleichen Form? Das würde dann m.M. nach eher auf die Platte deuten, denn (gleiche Firmware vorausgesetzt) hätten Treiber und Controller ja bei der vorigen Platte genau gleich reagieren müssen, unabhängig davon, daß sie letztlich wegen eines anderen Defekts ausgeschieden wurde.

Bezüglich des Runterschaltens auf SATA150 fällt mir ein: Die Seagates lassen sich per Jumper auf diese Geschwindigkeit fixieren. Das soll für ältere/buggy 150er-Controller helfen, die mit dem automatischen Zurückschalten nicht klar kommen. Eventuell probierst du mal, diesen Jumper zu setzen. Nur um zu sehen, wie sich das auswirkt. Dauerlösung ist das natürlich nicht, wenn beide Komponenten eigentlich SATA300 können.
Grüße!
  Das Geheimnis des Linux-Kernels   Support-Anfragen per PN sind der kürzeste Weg in die Ignorierliste   "Bin Anfänger" ist keine Ausrede

silberzwiebel

Anfänger

Beiträge: 7

Distribution: Ubuntu

Version: 9.10

Architektur: 64-Bit PC

Desktop: GNOME

7

Montag, 8. Februar 2010, 21:45

so, habe nun das Problem erstmals unter Windows 7 gehabt.
foobar2000 (musikplayer) meldet:

Quellcode

1
2
3
4
5
6
7
8
Decoding failure at 3:01.356 (Device not ready):
"D:\musik\lied1.mp3"

Unable to open item for playback (I/O error (win32 #55)):
"D:\musik\lied2.mp3"

Unable to open item for playback (Object not found):
"D:\musik\lied3.mp3"

Und dann die restlichen Lieder des Albums mit der letzten Fehlermeldung durch.
Die Platte ist im Windows-Explorer auch verschwunden.

Damit kann man dann wohl den Linux-Kernel-Bug ausschließen, oder?

Ein weiterer Grund übrigens, weshalb Ubuntu/Linux hier wieder klar punktet: Unter Ubuntu taucht die Platte im Prinzip direkt wieder auf. Unter Windows ist sie jetzt komplett verschwunden und ich kann sie nicht mehr mounten. Hilft also nur ein Neustart...

Und noch ein Punkt für Ubuntu: In der (nach langem Suchen endlich gefundenen) Windows-Log-Datei taucht überhaupt kein Eintrag bezüglich des Problems auf.

Das mit dem Jumper hatte ich mir auch schon gedacht. Dieses Experiment scheitert aber leider daran, dass ich keinen Jumper habe :(

8

Dienstag, 9. Februar 2010, 00:35

Damit kann man dann wohl den Linux-Kernel-Bug ausschließen, oder?
Würd ich auch meinen.
Bleibt noch der Controller (obwohl der dann sicher schon berühmt wäre, wenn das auch unter Windows auftritt), und eben die Siegeht...
Mein Beileid :(
Grüße!
  Das Geheimnis des Linux-Kernels   Support-Anfragen per PN sind der kürzeste Weg in die Ignorierliste   "Bin Anfänger" ist keine Ausrede

DocHifi

Fortgeschrittener

Beiträge: 312

Wohnort: Hamburg, St.Pauli

Distribution: Ubuntu

Version: Lucid Lynx und Karmic Koala

Architektur: 32-Bit PC

Desktop: GNOME

Andere Distribution: Sidux auf USB Stick Win XP auf HDD

9

Dienstag, 9. Februar 2010, 00:38

eben die Siegeht..
Seagate oder Seagate geht nicht. ;)
Gruß DocHifi
Dell Inspirion 8600, 1,4 GHZ, Intel Centrino, ATI Radeon 9600 pro Turbo, 2 GB Ram, 10.04 Lucid
Epox 8KTA+, Athlon XP 1700+, 1 GB Ram, Nvidia Geforce 64 MB, Ubuntu 9,10 Karmic
IBM Thinkpad T23 1,113 MHZ, 256 MB Ram, WIN 2000

Und bitte keine Support Anfragen per PN, danke.

silberzwiebel

Anfänger

Beiträge: 7

Distribution: Ubuntu

Version: 9.10

Architektur: 64-Bit PC

Desktop: GNOME

10

Dienstag, 16. Februar 2010, 20:08

Neue Nachrichten: Habe glücklicherweise eine weitere SATA-II-Platte hier rumfliegen gehabt und habe diese zusätzlich eingebaut, vor allem um meine Daten zu sichern. Das hat auch problemlos geklappt. (obwohl das ein langer Kopiervorgang war).

Heute dann folgendes: Diese zweite Platte ist, wie oben beschrieben, verschwunden. Da es unter Windows passiert ist, hab ich keinerlei Fehlermeldung. Aber ich denke, das Problem ist genau dasselbe.
Es liegt also offensichtlich nicht an der Festplatte (die zweite, die jetzt verschwunden ist, ist übrigens ein No-Name Produkt).

Ist also der Controller kaputt? Kennt ihr da irgendwelche Tools, die das Checken könnten? Ich befürchte, dass das der Fall ist. Und mir graut es schon davor das Motherboard umzutauschen :( (Oder gibt es irgendwie eine Möglichkeit nur den Controller umzutauschen?)

Gruß,
Silberzwiebel

11

Dienstag, 16. Februar 2010, 23:54

gibt es irgendwie eine Möglichkeit nur den Controller umzutauschen
Klar - nennt man Löteisen :)

Versuch es zuvor vielleicht mit einem neu geflashten BIOS...
Good luck! :thumbup:
Grüße!
  Das Geheimnis des Linux-Kernels   Support-Anfragen per PN sind der kürzeste Weg in die Ignorierliste   "Bin Anfänger" ist keine Ausrede