Tier 2 federado para ATLAS

Tier­2 federado para ATLAS IFIC: Estado operacional y recursos Javier Sánchez  / Alejandro Lamas 29­Mayo­2007 IFIC: Estado operacional y recursos 1

2 downloads 140 Views 2MB Size

Recommend Stories


Atlas de Transparencias para Retroproyector
Atlas de Transparencias para Retroproyector ATLAS DE TRANSPARENCIAS PARA RETROPROYECTOR Atlas de transparencias para retroproyector como recursos vis

02 Reading (Higher Tier)
THIS IS A NEW SPECIFICATION H GENERAL CERTIFICATE OF SECONDARY EDUCATION A723/02 SPANISH Reading (Higher Tier) * O C E / 1 8 7 1 9 * Thursday 27

01 Reading (Foundation Tier)
THIS IS A NEW SPECIFICATION F GENERAL CERTIFICATE OF SECONDARY EDUCATION A723/01 SPANISH Reading (Foundation Tier) * O C E / 1 8 7 1 8 * Thursday

landpower, motores tier 3
landpower, motorES tier 3 Y TRANSMISION DE CONTROL ELECTRONICO PARA PRESTACIONES EMOCIONANTES El tractor Landpower se presenta renovado con los nuevos

Atlas of Ancient Worlds
Egipto Antiguo Atlas of Ancient Worlds. Peter Chrisp. New York: Dorling Kindersley, 2009. p24-25. Topic overview COPYRIGHT 2009 Dorling Kindersley Ltd

Motores neumáticos Atlas Copco
Motores neumáticos Atlas Copco Atlas Copco – motores neumáticos • A la cabeza de la industria en desarrollo e innovación. • Una extensa gama de moto

Story Transcript

Tier­2 federado para ATLAS IFIC: Estado operacional y recursos Javier Sánchez  / Alejandro Lamas

29­Mayo­2007

IFIC: Estado operacional y recursos

1

Instalaciones: CPD del IFIC Incrementar la capacidad del CPD  Superficie de 90 a 150 m2  UPS de 50 KVA a 250 KVA  Instalar 70 líneas de 16Amps, 3 por rack  Cambiar el sistema de aire  acondicionado por uno partido con  impulsión en suelo técnico  Nuevos racks  Redistribución de todas las máquinas de  la sala de cálculo Planes:  Mayo: redacción del proyecto  Junio­Julio: concurso público  Sep­Oct­Nov: ejecución   29­Mayo­2007

IFIC: Estado operacional y recursos

2

Instalaciones: Red ●









Los recursos del Tier­2 en el IFIC están ubicados en el centro  de cálculo del IFIC en la nave experimental. A la nave llegan 4 pares de fibras ópticas multimodo En la actualidad se emplea un par para la conexión a GbE a la  troncal de la Universitat de València (10 GbE) En el futuro se conectará a 10 GbE El PoP de RedIRIS de la Comunidad Valenciana está en el  CPD de la Universitat 29­Mayo­2007

IFIC: Estado operacional y recursos

3

Instalaciones: Red ●







Los WN están conectados locamente a un switch de  FastEthernet con uplink de GbE. Los switches se conectan a un switch de GbE non­blocking Los servidores de disco y gridftp están conectados a GbE  directamente En los próximos meses se conectarán todos a GbE (tanto WN,  como servidores) siempre que tengan este interfaz

29­Mayo­2007

IFIC: Estado operacional y recursos

4

Recursos actuales: Servicios Máquina

Servicio

lcg2ce

CE

ce01 CE lcg2ui UI lcg2ui2 UI ui02 UI ui03 UI ● aaa lcg2bdii BDII (top) lcg2rb RB lcg2rb2 RB lcg2mon MON lcg2proxy PROXY 29­Mayo­2007

Máquina Servicio qtt1 quattor, dhcpd qtt2 repositorio gse03 software de las Vos

Máquina Servicio castorgrid01 gridftp (castorgrid) castorgrid02 gridftp (castorgrid) castorsrm SRM

IFIC: Estado operacional y recursos

5

Recursos actuales: WN #

CPU

Cores Mem/core Ksi2K/core cputmult Ksi2K

8

 AMD Athlon 1.2GHz

1

1 GB

0.51

0.81

3.28

67  AMD Athlon 1.4GHz

1

1 GB

0.51

0.98

33.22

32 Intel Pentium D 3.2GHz

2

2 GB

1.49

1.00

95.49

44 nodos del tipo 1 están apagados actualmente (18KSi2K)

131.99

10 WN Intel Pentium D aún no añadidos al ce01.  Están siendo empleados en pruebas (30 KSi2K) 29­Mayo­2007

IFIC: Estado operacional y recursos

6

Recursos actuales: WN  Algunos problemas con Torque/Maui:



'showstats' mata a veces el daemon de maui ● En alguna ocasión han quedado varios trabajos asignados al  mismo nodo sin correr (problemas de comunicación entre el  pbs_server y el pbs_mom) ●  Los nodos antiguos empiezan a tener fallos de hardware (disco y  ventiladores). Se reparan y se vuelven a poner en servicio. ●  La ocupación del ce (lcg2ce) hace a veces inaccesible el site bdii ●

29­Mayo­2007

IFIC: Estado operacional y recursos

7

Recursos actuales: WN  Fairshare implementado en ce01: ● 70% ATLAS (atlas: 50%, atlp: 50%), 30% IFIC



         |­­­­­­ Active ­­­­­­|­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­­ Completed ­­­­| group     Jobs Procs ProcHours Jobs     %    PHReq      %    PHDed     %   FSTgt atlas        0     0      0.00 15694  34.86 869851.0  37.10 53091.9  35.67 50.00 atlp        58    58   5282.31  5454  12.11 417814.2  17.82 46306.1  31.11 50.00 atls         1     1      1.00 10557  23.45 513304.0  21.8 9 2196.0   1.48  5.00 ops          0     0      0.00  3702   8.22  29464.0   1.26   209.7   0.14  2.00 dteam        0     0      0.00  3234   7.18  35688.0   1.52   182.3   0.12  2.00 swetest      0     0      0.00    23   0.05   1420.0   0.06    37.9   0.03  5.00 ific         0     0      0.00  6361  14.13 477109.0  20.35 46813.2  31.45 30.00

¡ Parece que funciona ! 29­Mayo­2007

IFIC: Estado operacional y recursos

8

Recursos actuales: Almacenamiento Máquina Configuración Capacidad Neta gse04

6xR1D2 160 GB

0.88 TB

gse05

6xR1D2 160 GB

0.88 TB

gse06

6xR1D2 160 GB

0.88 TB

gse07

6xR1D2 200 GB

1.10 TB

gse08

6xR1D2 200 GB

1.10 TB

gse09 1xR5D12 400 GB

4.74 TB 4.00 TB 4.00 TB

29­Mayo­2007

IFICTAPE IFICDISK

IFIC: Estado operacional y recursos

9

Recursos actuales: Almacenamiento  Almacenamiento basado en CASTOR v1



 IFICTAPE y IFICDISK en dos stagers distintos ●  Un único espacio de nombres ●  Selección del stager en función del path ● ^/castor/ific.uv.es/grid/atlas/DA           stage02.ific.uv.es ● ^/castor/ific.uv.es/grid/atlas/SC4DA    stage02.ific.uv.es ● ^/castor/ific.uv.es                                  stage01.ific.uv.es ●  Modificaciones en libshift.so, gridftp y srm daemon ●  Problemas con el software de ATLAS que instala su propio  libshift.so ●

29­Mayo­2007

IFIC: Estado operacional y recursos

10

Recursos actuales: Almacenamiento  IFICDISK emplea un truco de CASTOR:



MAXDRIVES                                                     0 ● RETENP_ON_DISK        INFINITE_LIFETIME ●  Problemas: ● Cuando un fichero se borra del espacio de nombres (nsrm)  el fichero no se elimina físicamente del servidor de disco ● El interfaz SRM sólo hace 'advisory deletings', o sea, que  ni siquiera borra el fichero del espacio de nombres (nsrm) ●  Es necesario correr scripts continuamente para mantener la  coherencia del servidor de disco y del stager. ●

29­Mayo­2007

IFIC: Estado operacional y recursos

11

Uso de los recursos  Alta ocupancia de los WN ●  Algunos nodos de lcg2ce  apagados por falta de  electricidad ●

 IFICTAPE: 225 cintas (45TB sin compresión) ●  IFICDISK: 3.60 TB (91%) ●

29­Mayo­2007

IFIC: Estado operacional y recursos

12

Planes próximos  Creación del site IFIC para sustituir a IFIC­LCG2



 Puesta en marcha de la nueva versión de quattor  ●  Uso de certificados IRISGrid ●  Añadir servicios/WN en SL 4 (64 bit) ●  Puesta en marcha de los 4 SunFire X4500 en Lustre (dCache) ●  Instalación del switch CISCO 4506. Conectar todas las  máquinas a GbE (con channel bonding) ●  Instalar un Site­BDII en una máquina separada ●  Monitorización con Nagios ●

29­Mayo­2007

IFIC: Estado operacional y recursos

13

Fortalecimiento de servicios Máquina

Tipo

Alimentación

CPU

Memoria

CE

RAID­1

Redundante

4 Cores

8 GB

RB

RAID­1

Redundante

4 Cores

8 GB

MON

RAID­1

Redundante

4 Cores

8 GB

Tomcat

UI

RAID­1

Redundante

4 Cores

8 GB

Programas de usuarios

TOP BDII

2xHA

Normal

Dual Core

4 GB

Trabajo en paralelo

SITE BDII

2xHA

Normal

Dual Core

4 GB

Trabajo en paralelo

Proxy

2xHA

Normal

Dual Core

2 GB

sync de directorios

VO

2xHA

Normal

Dual Core

2 GB

sync de directorios

29­Mayo­2007

IFIC: Estado operacional y recursos

comentarios

14

Conclusiones ●







La capacidad de CPU y almacenamiento cumple con los  planes Los servicios han funcionado razonablemente bien Se hará un esfuerzo para ofertar la capacidad de disco  comprometida en Julio­2007 Se procurará que las modificaciones del CPD del IFIC  afecten lo menos posible al funcionamiento del Tier­2  29­Mayo­2007

IFIC: Estado operacional y recursos

15

Backup: Recursos de cálculo científico y procesado de  datos en IFIC

29­Mayo­2007

IFIC: Estado operacional y recursos

16

Backup: Recursos de cálculo científico y procesado de  datos en IFIC

29­Mayo­2007

IFIC: Estado operacional y recursos

17

Get in touch

Social

© Copyright 2013 - 2024 MYDOKUMENT.COM - All rights reserved.