🧩 단일입자 분석(SPA)과 워크스테이션의 필요성
— Cryo-EM과 Negative-stain EM 데이터를 다루는 현실적인 접근
1️⃣ 단일입자 분석(Single-Particle Analysis, SPA)이란?
단일입자 분석(SPA)은 전자현미경(EM)으로 촬영한 개별 입자 이미지를 정렬·평균화하여 3D 구조를 복원하는 계산 기법입니다. Cryo-EM과 Negative-stain EM 모두 동일한 계산 원리를 사용합니다.
- Cryo-EM SPA: 수십만 장 규모의 입자 이미지로 원자 수준 해상도에 도달 가능
- Negative-stain EM SPA: 수천 장 규모로 중저해상도 구조를 얻어 초기 스크리닝·품질 평가에 적합
일반적인 처리 단계:
- Motion Correction – 데이터를 movie로 수집한 경우에만 수행 가능. 일부 현미경/구형 카메라는 미지원
- CTF Estimation – 위상대조함수 추정
- Particle Picking – 자동/수동 입자 좌표 추출
- 2D Classification – 유사 이미지 정렬·평균화
- 3D Reconstruction & Refinement – 3D 복원 및 정밀화
2️⃣ Cryo-EM vs Negative-stain EM (SPA 관점 비교)
| 구분 | Cryo-EM | Negative-stain EM |
|---|---|---|
| 시료 상태 | 비트리어스 아이스(vitreous ice) 내 입자 | 얇은 탄소 필름 위 입자, 중금속(예: 우라닐 아세테이트, 포스포텅스텐산) 염색 |
| 데이터 크기 | 수백 GB–수 TB | 수백 MB–수 GB |
| 결과물 노이즈 | 상대적으로 높음(저대비) | 상대적으로 낮음(염색으로 대비↑) |
| 해상도 | 원자 수준까지 가능 | 중저해상도(대략 10–20 Å) |
| 목적 | 고해상도 구조 해석 | 초기 형태 확인·시료 품질 점검 |
주: Negative-stain 염색에 사용하는 대표적 중금속 염료로 우라닐 아세테이트(UA), **포스포텅스텐산(PTA)**가 널리 쓰입니다.
3️⃣ 왜 워크스테이션이 필요한가
SPA는 GPU·CPU·RAM·스토리지 I/O를 모두 많이 소모합니다. 특히 Cryo-EM은 클라우드급 자원을 요구하는 경우가 흔합니다.
- CPU: 64코어 이상
- RAM: 512 GB 이상
- GPU: 고용량 VRAM GPU 여러 장
- Scratch SSD: 1 TB+ (임시 파일)
- Storage: 수십 TB
개인이 구축하기엔 부담이 큽니다.
4️⃣ 현실적 대안 — 실습용/소형 데이터셋용 워크스테이션
이 시리즈는 랩탑 워크스테이션 급으로 Negative-stain 데이터와 소형 Cryo-EM 데이터셋을 학습/연습하는 방법을 다룹니다.
제가 실제 사용하는 환경:
- GPU: NVIDIA Quadro RTX 5000 (16 GB VRAM)
- CPU: 12코어(24스레드)
- RAM: 64 GB
- Main Storage: 1 TB NVMe
- External Storage: 4 TB SSD
이 구성으로 RELION과 CryoSPARC를 동시 운용하며 Negative-stain 중심 분석을 수행하고, 수백 GB 규모의 Cryo-EM 소형 데이터셋도 처리 가능합니다(대형 프로젝트는 한계).
즉, 이 워크스테이션은
- 실제 SPA 소프트웨어를 직접 설치·운용하고
- 작은 데이터로 전 과정을 반복 학습하며
- Cryo-EM 분석 흐름을 체득하는 개인 실습 플랫폼입니다.
5️⃣ 결론
작은 워크스테이션은 제한이 있지만 데이터 흐름을 몸으로 익히기에 가장 효율적입니다. 특히 Negative-stain은 빠른 피드백과 작은 용량 덕분에 SPA 입문·연습에 최적입니다. 다음 편부터는 하드웨어 사양 선택 → OS·CUDA 설치 → CryoSPARC/RELION 통합까지 단계별로 안내하겠습니다.
요약
- Cryo-EM과 Negative-stain 모두 SPA 기법 사용
- Motion correction은 movie 지원 카메라에서만 가능
- Cryo-EM은 클라우드급 자원, Negative-stain은 소규모 워크스테이션으로 충분
- RTX 5000/64 GB/1 TB NVMe/외장 4 TB 구성으로 실습·소형 데이터셋 처리 가능