Tive problemas com o RAID de uma das máquinas. Por algum motivo, um dos discos saltou fora do RAID 1.
Fui à procura na net e encontrei dois sítios com informação importante:
Replacing A Failed Hard Drive In A Software RAID1 Array
How to check ‘mdadm’ RAIDs while running?
Ao emitir o comando cat /proc/mdstat
o resultado foi o seguinte:
md2 : active raid1 sdf1[1] sde1[0]
1953512400 blocks super 1.2 [2/2] [UU]
md3 : active raid1 sdd1[1]
1953512400 blocks super 1.2 [2/1] [_U]
md0 : active raid1 sda3[0] sdb3[1]
73939072 blocks [2/2] [UU]
No md3 faltava o sdc1. Se estivesse lá, mas com erro, teria que ser removido primeiro, com os comandos seguintes:
mdadm --manage /dev/md3 --fail /dev/sdc1
mdadm --manage /dev/md3 --remove /dev/sdc1
E depois, desligaria a máquina e, se o disco estivesse mesmo avariado, trocaria o disco.
É necessário criar uma partição igual à da partição sdd1. Para comparar as partições, emitir o comando fdisk -l
, cujo resultado, para os discos em causa, é:
Disk /dev/sdc: 1.8 TiB, 2000398934016 bytes, 3907029168 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disklabel type: dos
Disk identifier: 0x98f9dba0
Device Boot Start End Sectors Size Id Type
/dev/sdc1 2048 3907029167 3907027120 1.8T fd Linux raid autodetect
Disk /dev/sdd: 1.8 TiB, 2000398934016 bytes, 3907029168 sectors
Units: sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disklabel type: dos
Disk identifier: 0xbe1f7c22
Device Boot Start End Sectors Size Id Type
/dev/sdd1 2048 3907029167 3907027120 1.8T fd Linux raid autodetect
A partir daí, e para recolocar o disco novamente no RAID, o comando é o seguinte:
mdadm --manage /dev/md3 --add /dev/sdc1
A reconstrução do RAID é iniciada. Pode-se ir acompanhando o processo com o comando cat /proc/mdstat
md2 : active raid1 sdf1[1] sde1[0]
1953512400 blocks super 1.2 [2/2] [UU]
md3 : active raid1 sdc1[2] sdd1[1]
1953512400 blocks super 1.2 [2/1] [_U]
[=============>.......] recovery = 66.1% (1291278848/1953512400) finish=142.0min speed=77670K/sec
md0 : active raid1 sda3[0] sdb3[1]
73939072 blocks [2/2] [UU]
ou então com o comando mdadm -D /dev/md3
:
/dev/md3:
Version : 1.2
Creation Time : Sat Mar 10 21:20:35 2012
Raid Level : raid1
Array Size : 1953512400 (1863.01 GiB 2000.40 GB)
Used Dev Size : 1953512400 (1863.01 GiB 2000.40 GB)
Raid Devices : 2
Total Devices : 2
Persistence : Superblock is persistent
Update Time : Wed Apr 25 12:51:45 2018
State : clean, degraded, recovering
Active Devices : 1
Working Devices : 2
Failed Devices : 0
Spare Devices : 1
Rebuild Status : 65% complete
Name : tao:3
UUID : 90d1dc37:d4fd77a4:a4a1d0fe:98a3717d
Events : 68048
Number Major Minor RaidDevice State
2 8 33 0 spare rebuilding /dev/sdc1
1 8 49 1 active sync /dev/sdd1