用make_viewpoints.py生成virtual-4C/capture-view profiles
python make_viewpoints.py \
-i sample_allValidPairs \
-f HindIII_resfrag_hg19.bed \
-t my_baits.bed \
-e 1000 \
-o sample \
-v常见问题
(1)确保BED有4列(chrom,start,end,name)。脚本不会接受少列的BED(会报 Warning: wrong input format 并退出)。
(2)exclusion的使用场景:若capture周围有强烈的近端偏好(例如self-ligation、restriction bias),推荐设-e 1000 或类似值把capture ±1 kb 排除再统计CAP-REP。脚本对exclusion做了独立计数(exclu_counter)。
(3)cis限制(-c):若只关心在target染色体上(只对与targets在同染色体的fragments做fragment tree),用-c可加速并避免跨染色体fragment计入(源码在load_BED(fragmentFile, chroms=target.keys())时使用),对于capture-centric分析有意义。
(4)输出转换:bedGraph通常转换为bigWig供浏览器使用:bedGraphToBigWig sample.bedgraph chrom.sizes sample.bw。如果要比较不同样品,建议先对counts做library size或有效对数(validPairs)归一化再转bigWig(脚本本身没有做归一化)。
(5)多重overlap警告:get_overlapping_fragment()在非exclusion检查时allow_multiple=False,若fragment文件定义不当(fragment间存在重叠),会出现“多个fragments found for read”的Warning并跳过这些配对。保证restriction fragment文件互不重叠是重要前提。