[임베디드 딥러닝] gprof 프로파일러를 이용해 딥러닝 최적화하기

임베디드 딥러닝

다락공방 2024. 8. 28. 02:47

나는 총 3가지의 최적화 기법을 사용하였는데, 하나 하나 살펴보자

다시 공부하니 최적화 기법이 엄청 길고 많아서 따로 정리하는 거도 좋겠다. 일단 여기서는 사용한것만 쓰겠다.

위 루프의 경우 i 가 10 보다 작은지 비교하고 있고, 아래 루프에서는 i 가 0 과 다른지 비교하고 있는데

일반적으로 0 과 비교하는 명령어는 CPU 에서 따로 만들어져 있기 때문에 더 빠르게 작동한다.

루프문을 굳이 쓰지 않고 쓸 수 있는 문장들은 되도록 직접 쓰는 것이 좋다.

for 문 자체에서 돌때마다 종류 조건 비교 및 변수 증가도 있으므로 시간이 든다.

포인터 체이닝은 구조체 내에서 정보를 액세스하기 위해 자주 사용된다.
코드에서는 각 할당(assign)마다 p->pos를 다시 로드해야 합니다. 이는 컴파일러가 p->pos->x가 p->pos의 별칭(alias)이 아니라고 판단하기 때문이다.
더 나은 방법은 p->pos를 로컬 변수에 캐시하는 것이다.