병렬 프로그래밍13 [기본] Thread Layout 설계 시 고려되어야 할 점들 CUDA로 프로그래밍을 진행하다 보면 고려해 줘야 할 조건들이 굉장히 많습니다. 특히 일반적으로 CPU에서 동작하는 코드에 비해서 하드웨어 스펙에 의존성이 더 큽니다. 따라서, 이번에는 Thread Layout 설계할 때 성능상 고려해 줘야 하는 것에는 어떤 것들이 있는지 이야기해 보겠습니다. 위의 이미지에서 확인할 수 있듯이 GPU는 여러개의 SM(Streaming Multiprocessor)로 구성되어 있고, SM내부에는 또 다수의 Thread(CUDA Core or SP)로 이루어져 있습니다. 그리고 우리는 최대 3차원까지 Grid, Block에 대해서 논리적인 Dimension을 지정해줄 수 있습니다. (Grid는 GPU를 의미하며 Block의 집합이고, Block은 SP단위에서 실행되며 Thre.. 2023. 1. 31. 이전 1 2 3 4 다음