🧩 단일입자 분석(SPA)과 워크스테이션의 필요성

— Cryo-EM과 Negative-stain EM 데이터를 다루는 현실적인 접근

1️⃣ 단일입자 분석(Single-Particle Analysis, SPA)이란?

단일입자 분석(SPA)은 전자현미경(EM)으로 촬영한 개별 입자 이미지를 정렬·평균화하여 3D 구조를 복원하는 계산 기법입니다. Cryo-EM과 Negative-stain EM 모두 동일한 계산 원리를 사용합니다.

  • Cryo-EM SPA: 수십만 장 규모의 입자 이미지로 원자 수준 해상도에 도달 가능
  • Negative-stain EM SPA: 수천 장 규모로 중저해상도 구조를 얻어 초기 스크리닝·품질 평가에 적합

일반적인 처리 단계:

  1. Motion Correction – 데이터를 movie로 수집한 경우에만 수행 가능. 일부 현미경/구형 카메라는 미지원
  2. CTF Estimation – 위상대조함수 추정
  3. Particle Picking – 자동/수동 입자 좌표 추출
  4. 2D Classification – 유사 이미지 정렬·평균화
  5. 3D Reconstruction & Refinement – 3D 복원 및 정밀화

2️⃣ Cryo-EM vs Negative-stain EM (SPA 관점 비교)

구분Cryo-EMNegative-stain EM
시료 상태비트리어스 아이스(vitreous ice) 내 입자얇은 탄소 필름 위 입자, 중금속(예: 우라닐 아세테이트, 포스포텅스텐산) 염색
데이터 크기수백 GB–수 TB수백 MB–수 GB
결과물 노이즈상대적으로 높음(저대비)상대적으로 낮음(염색으로 대비↑)
해상도원자 수준까지 가능중저해상도(대략 10–20 Å)
목적고해상도 구조 해석초기 형태 확인·시료 품질 점검

주: Negative-stain 염색에 사용하는 대표적 중금속 염료로 우라닐 아세테이트(UA), **포스포텅스텐산(PTA)**가 널리 쓰입니다.

3️⃣ 왜 워크스테이션이 필요한가

SPA는 GPU·CPU·RAM·스토리지 I/O를 모두 많이 소모합니다. 특히 Cryo-EM은 클라우드급 자원을 요구하는 경우가 흔합니다.

  • CPU: 64코어 이상
  • RAM: 512 GB 이상
  • GPU: 고용량 VRAM GPU 여러 장
  • Scratch SSD: 1 TB+ (임시 파일)
  • Storage: 수십 TB

개인이 구축하기엔 부담이 큽니다.

4️⃣ 현실적 대안 — 실습용/소형 데이터셋용 워크스테이션

이 시리즈는 랩탑 워크스테이션 급으로 Negative-stain 데이터와 소형 Cryo-EM 데이터셋을 학습/연습하는 방법을 다룹니다.

제가 실제 사용하는 환경:

  • GPU: NVIDIA Quadro RTX 5000 (16 GB VRAM)
  • CPU: 12코어(24스레드)
  • RAM: 64 GB
  • Main Storage: 1 TB NVMe
  • External Storage: 4 TB SSD

이 구성으로 RELION과 CryoSPARC를 동시 운용하며 Negative-stain 중심 분석을 수행하고, 수백 GB 규모의 Cryo-EM 소형 데이터셋도 처리 가능합니다(대형 프로젝트는 한계).

즉, 이 워크스테이션은

  • 실제 SPA 소프트웨어를 직접 설치·운용하고
  • 작은 데이터로 전 과정을 반복 학습하며
  • Cryo-EM 분석 흐름을 체득하는 개인 실습 플랫폼입니다.

5️⃣ 결론

작은 워크스테이션은 제한이 있지만 데이터 흐름을 몸으로 익히기에 가장 효율적입니다. 특히 Negative-stain은 빠른 피드백과 작은 용량 덕분에 SPA 입문·연습에 최적입니다. 다음 편부터는 하드웨어 사양 선택 → OS·CUDA 설치 → CryoSPARC/RELION 통합까지 단계별로 안내하겠습니다.

요약

  • Cryo-EM과 Negative-stain 모두 SPA 기법 사용
  • Motion correction은 movie 지원 카메라에서만 가능
  • Cryo-EM은 클라우드급 자원, Negative-stain은 소규모 워크스테이션으로 충분
  • RTX 5000/64 GB/1 TB NVMe/외장 4 TB 구성으로 실습·소형 데이터셋 처리 가능