대학원 생활5 HEP04 columnar database in HEP 정말 오랜만에 글을 올린다. 그동안 졸업시험 보랴 연구하랴 다른 공부하랴 블로그에 손을 못 댔다. 그런 일상이 지속되고 있다가 오늘 아침 친구가 공유해준 기사 하나를 보고 아 다시 블로그를 써야겠다 다짐했다. 기사는 데이터 관련 직군에서 콘텐츠 제작의 중요성에 대한 글이었다. 매우 빠르게 변하는 시대, 새로운 기술을 배우고 본업에 적용해보는 것 등을 콘텐츠화해서 블로그에 저장해두는 것에 대한 중요성이다. 나 또한 이 블로그를 시작하게 된 계기 중에 하나가, High Energy Physics에서 배우는 통계, 코딩 스킬을 Real World에 적용할 수 있지 않을까이다. 반성하게 되었고 다시 초심으로 돌아가게 되었다. 비록 내 앞으로의 진로는 Physics 쪽이 아니지만 여기서 지내면서 얻은 기술들과 노.. 2022. 3. 31. CMS01: 2016 pre-VFP vs post-VFP CMS에서 연구를 하면서 느낀 점은, 문서화.. 문서화....! 문서화가 너무 난잡하게 되어 있어서 힘들다. 연구실에 다음 들어오는 학생을 위한 교육용, 스스로 정리용으로 계속 글을 올리겠다. 2021년 12월 10일 현재, CMS에서는 Ultra Legacy (UL)라 부르는 가장 완벽하게 가공된 형태의 데이터를 준비되어있다. 현재 하는 analysis는 Run-II dataset으로 2016-2018 년도에 받은 데이터들이 있다. 이때 2017과 2018은 문제가 안 되는데, 2016은 골치 아픈 문제가 있다. Run 중에 무슨 디텍터적인 문제가 발생한 건지 특정 Run number 기준으로 preVFP postVFP로 샘플들이 나눠져 있다. MC 샘플 같은 경우 2가지 버전의 같은 샘플이 있는 샘이.. 2021. 12. 10. HEP03 Reconstruct Z boson using Coffea #2 Processor 이전 버전에서 Coffea framework을 이용해서 NanoAOD를 analysis 하는 포스팅을 올렸다. Z boson mass를 reconstruct 하는 예제였다. 아래 링크를 참고하기 바란다. https://jwcorp.tistory.com/2?category=1011393 HEP02 Reconstruct Z boson using Coffea #1 Basic Coffea framework 와 CMS 의 NanoAOD type DY process 샘플을 가지고 Electron pair 을 selection 하여 Z boson mass peak 을 reconstruction 하는 튜토리얼이다. [Jupyter notebook 링크] 와 함께 이 글을 보기.. jwcorp.tistory.com 이번.. 2021. 12. 10. HEP02 Reconstruct Z boson using Coffea #1 Basic Coffea framework 와 CMS 의 NanoAOD type DY process 샘플을 가지고 Electron pair 을 selection 하여 Z boson mass peak 을 reconstruction 하는 튜토리얼이다. [Jupyter notebook 링크] 와 함께 이 글을 보기를 추천한다. 이 튜토리얼은 Coffea 를 이용해서 data analysis 를 하는 Flow 를 설명하기 위해 Jupyter notebook 으로 interactive 한 방법으로 작성되었다. 하지만 실전에서는 대용량의 데이터를 다루기 때문에, 램 용량의 한계로 interative 방법은 못 쓰고, processor 라는 coffea 에서 제공하는 다른 방식을 사용하게 된다. processor 는 차후에 #2.. 2021. 7. 19. 이전 1 2 다음