Motores neumáticos Atlas Copco
Atlas Copco – motores neumáticos • A la cabeza de la industria en desarrollo e innovación. • Una extensa gama de moto
Story Transcript
Tier2 federado para ATLAS IFIC: Estado operacional y recursos Javier Sánchez / Alejandro Lamas
29Mayo2007
IFIC: Estado operacional y recursos
1
Instalaciones: CPD del IFIC Incrementar la capacidad del CPD Superficie de 90 a 150 m2 UPS de 50 KVA a 250 KVA Instalar 70 líneas de 16Amps, 3 por rack Cambiar el sistema de aire acondicionado por uno partido con impulsión en suelo técnico Nuevos racks Redistribución de todas las máquinas de la sala de cálculo Planes: Mayo: redacción del proyecto JunioJulio: concurso público SepOctNov: ejecución 29Mayo2007
IFIC: Estado operacional y recursos
2
Instalaciones: Red ●
●
●
●
●
Los recursos del Tier2 en el IFIC están ubicados en el centro de cálculo del IFIC en la nave experimental. A la nave llegan 4 pares de fibras ópticas multimodo En la actualidad se emplea un par para la conexión a GbE a la troncal de la Universitat de València (10 GbE) En el futuro se conectará a 10 GbE El PoP de RedIRIS de la Comunidad Valenciana está en el CPD de la Universitat 29Mayo2007
IFIC: Estado operacional y recursos
3
Instalaciones: Red ●
●
●
●
Los WN están conectados locamente a un switch de FastEthernet con uplink de GbE. Los switches se conectan a un switch de GbE nonblocking Los servidores de disco y gridftp están conectados a GbE directamente En los próximos meses se conectarán todos a GbE (tanto WN, como servidores) siempre que tengan este interfaz
44 nodos del tipo 1 están apagados actualmente (18KSi2K)
131.99
10 WN Intel Pentium D aún no añadidos al ce01. Están siendo empleados en pruebas (30 KSi2K) 29Mayo2007
IFIC: Estado operacional y recursos
6
Recursos actuales: WN Algunos problemas con Torque/Maui:
●
'showstats' mata a veces el daemon de maui ● En alguna ocasión han quedado varios trabajos asignados al mismo nodo sin correr (problemas de comunicación entre el pbs_server y el pbs_mom) ● Los nodos antiguos empiezan a tener fallos de hardware (disco y ventiladores). Se reparan y se vuelven a poner en servicio. ● La ocupación del ce (lcg2ce) hace a veces inaccesible el site bdii ●
Recursos actuales: Almacenamiento Almacenamiento basado en CASTOR v1
●
IFICTAPE y IFICDISK en dos stagers distintos ● Un único espacio de nombres ● Selección del stager en función del path ● ^/castor/ific.uv.es/grid/atlas/DA stage02.ific.uv.es ● ^/castor/ific.uv.es/grid/atlas/SC4DA stage02.ific.uv.es ● ^/castor/ific.uv.es stage01.ific.uv.es ● Modificaciones en libshift.so, gridftp y srm daemon ● Problemas con el software de ATLAS que instala su propio libshift.so ●
29Mayo2007
IFIC: Estado operacional y recursos
10
Recursos actuales: Almacenamiento IFICDISK emplea un truco de CASTOR:
●
MAXDRIVES 0 ● RETENP_ON_DISK INFINITE_LIFETIME ● Problemas: ● Cuando un fichero se borra del espacio de nombres (nsrm) el fichero no se elimina físicamente del servidor de disco ● El interfaz SRM sólo hace 'advisory deletings', o sea, que ni siquiera borra el fichero del espacio de nombres (nsrm) ● Es necesario correr scripts continuamente para mantener la coherencia del servidor de disco y del stager. ●
29Mayo2007
IFIC: Estado operacional y recursos
11
Uso de los recursos Alta ocupancia de los WN ● Algunos nodos de lcg2ce apagados por falta de electricidad ●
Planes próximos Creación del site IFIC para sustituir a IFICLCG2
●
Puesta en marcha de la nueva versión de quattor ● Uso de certificados IRISGrid ● Añadir servicios/WN en SL 4 (64 bit) ● Puesta en marcha de los 4 SunFire X4500 en Lustre (dCache) ● Instalación del switch CISCO 4506. Conectar todas las máquinas a GbE (con channel bonding) ● Instalar un SiteBDII en una máquina separada ● Monitorización con Nagios ●
29Mayo2007
IFIC: Estado operacional y recursos
13
Fortalecimiento de servicios Máquina
Tipo
Alimentación
CPU
Memoria
CE
RAID1
Redundante
4 Cores
8 GB
RB
RAID1
Redundante
4 Cores
8 GB
MON
RAID1
Redundante
4 Cores
8 GB
Tomcat
UI
RAID1
Redundante
4 Cores
8 GB
Programas de usuarios
TOP BDII
2xHA
Normal
Dual Core
4 GB
Trabajo en paralelo
SITE BDII
2xHA
Normal
Dual Core
4 GB
Trabajo en paralelo
Proxy
2xHA
Normal
Dual Core
2 GB
sync de directorios
VO
2xHA
Normal
Dual Core
2 GB
sync de directorios
29Mayo2007
IFIC: Estado operacional y recursos
comentarios
14
Conclusiones ●
●
●
●
La capacidad de CPU y almacenamiento cumple con los planes Los servicios han funcionado razonablemente bien Se hará un esfuerzo para ofertar la capacidad de disco comprometida en Julio2007 Se procurará que las modificaciones del CPD del IFIC afecten lo menos posible al funcionamiento del Tier2 29Mayo2007
IFIC: Estado operacional y recursos
15
Backup: Recursos de cálculo científico y procesado de datos en IFIC
29Mayo2007
IFIC: Estado operacional y recursos
16
Backup: Recursos de cálculo científico y procesado de datos en IFIC