본문 바로가기

Hep4

CMS01: 2016 pre-VFP vs post-VFP CMS에서 연구를 하면서 느낀 점은, 문서화.. 문서화....! 문서화가 너무 난잡하게 되어 있어서 힘들다. 연구실에 다음 들어오는 학생을 위한 교육용, 스스로 정리용으로 계속 글을 올리겠다. 2021년 12월 10일 현재, CMS에서는 Ultra Legacy (UL)라 부르는 가장 완벽하게 가공된 형태의 데이터를 준비되어있다. 현재 하는 analysis는 Run-II dataset으로 2016-2018 년도에 받은 데이터들이 있다. 이때 2017과 2018은 문제가 안 되는데, 2016은 골치 아픈 문제가 있다. Run 중에 무슨 디텍터적인 문제가 발생한 건지 특정 Run number 기준으로 preVFP postVFP로 샘플들이 나눠져 있다. MC 샘플 같은 경우 2가지 버전의 같은 샘플이 있는 샘이.. 2021. 12. 10.
HEP03 Reconstruct Z boson using Coffea #2 Processor 이전 버전에서 Coffea framework을 이용해서 NanoAOD를 analysis 하는 포스팅을 올렸다. Z boson mass를 reconstruct 하는 예제였다. 아래 링크를 참고하기 바란다. https://jwcorp.tistory.com/2?category=1011393 HEP02 Reconstruct Z boson using Coffea #1 Basic Coffea framework 와 CMS 의 NanoAOD type DY process 샘플을 가지고 Electron pair 을 selection 하여 Z boson mass peak 을 reconstruction 하는 튜토리얼이다. [Jupyter notebook 링크] 와 함께 이 글을 보기.. jwcorp.tistory.com 이번.. 2021. 12. 10.
HEP02 Reconstruct Z boson using Coffea #1 Basic Coffea framework 와 CMS 의 NanoAOD type DY process 샘플을 가지고 Electron pair 을 selection 하여 Z boson mass peak 을 reconstruction 하는 튜토리얼이다. [Jupyter notebook 링크] 와 함께 이 글을 보기를 추천한다. 이 튜토리얼은 Coffea 를 이용해서 data analysis 를 하는 Flow 를 설명하기 위해 Jupyter notebook 으로 interactive 한 방법으로 작성되었다. 하지만 실전에서는 대용량의 데이터를 다루기 때문에, 램 용량의 한계로 interative 방법은 못 쓰고, processor 라는 coffea 에서 제공하는 다른 방식을 사용하게 된다. processor 는 차후에 #2.. 2021. 7. 19.
HEP01 Data cleaning using Coffea framework in CMS Coffea Framework 을 이용해서, CMS data분석을 하는중에, 문서화가 너무 안 되어있어서 가장 처음으로 하는겸, 내가 잊어버리지 않으려고 정리를 시작한다. 가장 첫 번째로, 어떻게 Golden Json File 을 이용해서 GoodRun 이벤트만 골라내는지에 관한 내용을 써보았다. (글의 순서는 바뀔 수 있다) CMS 검출기로 부터 데이터를 얻을때, 특정 기간 동안에는 기기 고장 등, 이슈가 발생해서 Quality 가 좋지 못한 데이터 또한 스토리지에 들어올 수 있다. 다행히, CMS 데이터는 Run number 와 Luminosity Block 으로 언제 taken 된 데이터 인지 알아 낼 수 있고, 이를 통해서 정상적인 기간 동안의 데이터만 따로 얻을 수 있다. 이러한 데이터를 정리해.. 2021. 7. 17.