밤에 잠도 제대로 못잔다. 업무에 차질도 가끔 생긴다. 난 철인이 아니다.
신규도입된 서버는 Tyan toledo i3010w 해외판매가 23만원, 국내판매가 50만원의 마더보드가 사용되었다.
서버가 미쳐나가는통에 국내에서 사야만 했다. 나는 별다른 이유없이 가격튀겨파는게 싫다.
또한 챈브로 샤시로 하드웨어 호환성과 안정성을 높였으며, 4개의 핫스왑 SATA베이와 안정적인 600W 전원공급.
별도주문한 BMC카드를 삽입하여 원격 전원관리 및 KVM 기능을 지원한다.
이는 긴급장애 발생시나 최근 발생하는 커널업데이트등의 문제에 유연하게 대처하기 위해 필요하다.
전체적인 시스템은 PXE를 통해 이 서버군 (3대)에 대해서 자동설치되도록 새로 설정하였고,
구매가 되는기간동안 시스템 인터그레이션으로 약 8시간을 할당하였다.
예전 엔지니어링을 할때로 기준으로 보면 이 작업에 대한 비용은 소프트웨어분야로써 약300만원어치다.
그러나 여기서 문제가 발생한다.
PXE 가 되지 않는다. 명백한 바이오스 오류로 지금은 패치가 되었다.
그러나 패치가 되기 이전 타이안 본사를 통해 많은 서포팅 과정이 이루어졌다.
그러나 타이안은 생각보다 빠르게 110F 바이오스를 3일정도만에 보내주었고 그 3일뒤 111 바이오스를 정식 릴리즈하였다.
따라서 PXE가 되지않아 추가로 6시간가량 각 서버 1대1대를 셋팅하였다.
추가비용이 300만원가량 발생했다. 또한 컴파일과정을 지켜보아야 하는등의 특수서버 설정이 포함된 단가는 800만원/대당 이다. (자사기준에는 적용되지않지만 외부업체의 경우 이 단가가 적용된다)
이 서버는 웹서버로써 동급 서버보다 3배이상의 압도적인 퍼포먼스를 보여줄것임을 자신한다.
다른 기업의 서버는 모르겠지만 본사서버들은 최악조건의 스트레스 테스트수준의 서비스를 유지해나가고 있다.
로드테스트 initial bios 인 100 에서는 모든 스트레스 테스트를 정상적으로 통과하였다.
자체개발된 벤치마킹 프로그램은 서버의 구석구석 1%도 남기지않고 오류점을 점검한다.
그리고 급한 나머지 2대의 서버는 긴급투입되고 한대는 사무실에 남는다. 테스트용도다.
여기저기 찔러보기 시작한다. BIOS는 매우안정적이었다.
BMC를 연결하여 테스트를 한다. KVM기능이 동작하지 않는다 ;;
미치는거다.
타이안에 다시 연락을 한다. 또 111 바이오스가 새로 릴리즈된것을 확인을한다.
BIOS 를 업데이트했다. 벤치마킹도중 오류점이 다수 발견되었다.
정말 특이한 에러다. MTRR 관련 에러가 VGA 및 NIC 쪽에서 발견되었다.
이는 시스템의 버스코어와 직결되어 모든기능의 마비가능성이 40%나 된다.
이부분은 아직도 해결중이며 이때문에 요즘에도 새벽에 미국에 이메일에 전화질이다.
조금 놀랐던건 테크니컬 서포트로 메일질하던 사람이 전화하니 바로받더라 글로벌서비스센터가;;
직원이 몇명인지는 모르겠지만... 뭐 한방에 직통연결도 나쁘진않다만;;
최근 밤샌시간과 테스트로 인해 보낸 시간은 3년전 외부업체 작업가로 산정했을떄 이미 3천만원을 초과했다.
이렇게 지난것이 벌써 어영부영 2주가된다. 기존에 투입된 서버의 오류가능성이 다시 제기된것이다.
(통상적인 경우에는 발생하진 않겠지만 리소스 점유율이 또 올라가면 문제가 발생할 수 있다는 이야기)
어떻게 보면 IBM 같은 안정성 높은 서버를 구매하는것이 유리한부분이기도 하다.
(최근에는 인텔 서버보드 BMC와 관련하여 기술지원에서 대 실망을 한 이후로 인텔은 서버로 취급하지 않기로 결정했다)
불안정한 기능을 된다고 써놓고 팔진 않으니깐말이다.
기업상담에 대해서는 여러 대기업 브랜드 서버와 컨택을 시도했지만, 뭐랄까 기술지원부분에서 말길을 못알아듣는 경우가 종종있다. 이런면에서는 IBM이 가장 잘한다고 보인다. 적어도 무슨말인지는 알아먹는다.
또 이런 자질구레한 패치로 인해 테스팅과 많은 시간을 할애하지 않아도 된다는것이다.
가만보면 브랜드 서버를 새로 사는게 나아보이긴 하지만;; 지금 이 서버와 동급 IBM 서버는 대당 800만원가량이 뜬다.. 미국사이트 기준이다.. 뭐 국내라면 1500은 봐야한다. 5배이상의 가격차다.
뭐 이런 틈새들이 있는데 이런부분을 메꿀만한 대응서버들은 딱히 보이지 않는다.
언젠가는 안정적으로 가긴가야되지만;; 이번달에만 추가될 3대의서버와 고성능 스위치, 고가용성 스토리지들로 벌써 5천가까운 출혈이 생기게됬다;;
사실 스토리지는 브랜드 고가용성 스토리지가 도입된다. 만들어쓰려고 했더니 수입하는데 비용과 시간과 관세가 많이붙는다 -_-;; 배송료도 압박인데 관세까지 내면 계산상 브랜드제품을 사는게 더 싸다.
또 파손위험들도있어서 선택의 폭이 좁았다.
여하튼 이번일로 전반적인 자체개발서버의 대응문제점이 다시 이슈화될런지는 모르겠다.
새로 도입된 서버는 최신기술로 무장했기 때문에 당분간의 안정화시간은 필요하긴하다. 브랜드 서버는 언제나 더 오랜기간뒤에 나오긴하지만
그러나 자체개발서버는 수년간 사용해왔음에도 매우 안정적이고, 잘 돌아간다는것을 보았을때..
자체서버를 중단하는일은 없지않을까 싶지만. 타이안의 신뢰가 무너지면 자체서버를 만들수가 없게된다.
현재로써는 타이안 이외의 선택은 존재하지 않기때문이다.
그나저나 이놈에 바이오스는 언제나 되야 다만들런지 걱정이다 -_-
Posted by LeCieL



