Separate Compilation1 [빌드] CUDA에서 Separate Compilation과 Linking 이슈 최근 PTX 어셈블리를 활용하여 실행 중인 SM 확인하기 (tistory.com) 이라는 글을 보고서, Debug 용으로 실행중인 Kernal의 Warp나 Thread 정보들을 출력할 수 있는 유틸 함수들을 추가하면 좋겠다는 생각을 하게 되었습니다. 그래서 기존에 헤더로만 구성되어 있던 util 코드를 소스코드와 헤더로 분리하고 위에 블로그에서 아래의 코드들을 복사해서 가져왔습니다. // utils.cu #include "utils.cuh" __device__ uint32_t __mysmid() { uint32_t smid; asm volatile("mov.u32 %0, %%smid;" : "=r"(smid)); return smid; } __device__ uint32_t __mywarpid() { u.. 2023. 3. 7. 이전 1 다음