야코비안 행렬
IT 위키
야코비안 행렬(영어: Jacobian matrix)은 다변수 벡터값 함수의 국소적 선형 근사를 나타내는 행렬로, 함수의 도함수 정보를 모아놓은 것이다. 미분학과 벡터 해석학에서 중요한 역할을 하며, 특히 변수 변환, 최적화, 비선형 방정식 해석, 기계학습 등에서 널리 사용된다.
이름[편집 | 원본 편집]
한편, 독일 수학자 카를 구스타프 야코비(Carl Gustav Jacob Jacobi)의 이름에서 유래하였기 때문에 자코비안 행렬 또는 야코비 행렬이라고도 불린다. 야코비안이란 "야코비의(Jacobi's)"의 의미를 나타내는 영어 표현이다. 자코비안은 야코비안을 미국식으로 읽은 것이며, 미국에선 대부분 영어 발음대로 읽어버리기 때문에 "야코비"보단 "자코비"라고 해버리는 경향이 있다. 하지만 한국에서는 외국인의 이름은 그 나라의 발음대로 발음해주므로 "야코비"라고 하는 것이다. 그리고 우리나라에선 이름을 형용사형으로 바꾸어 쓰는 문화가 없으므로 관례에 따른 정확한 한국식 표현은 "야코비 행렬"이다.
정의[편집 | 원본 편집]
n차원 벡터 함수
- f(x) = (f₁(x), f₂(x), …, f_m(x))
에서 x = (x₁, x₂, …, x_n)일 때, 야코비안 행렬 J는 각 함수 f_i의 편미분을 정리하여 구성한다.
J(f)(x) =
[ ∂f₁/∂x₁ ∂f₁/∂x₂ ... ∂f₁/∂xₙ ]
[ ∂f₂/∂x₁ ∂f₂/∂x₂ ... ∂f₂/∂xₙ ]
[ ... ... ... ... ]
[ ∂fₘ/∂x₁ ∂fₘ/∂x₂ ... ∂fₘ/∂xₙ ]
즉, m×n 행렬로 정의되며, (i, j) 성분은 함수 f_i를 변수 x_j로 편미분한 값이다.
성질[편집 | 원본 편집]
- 야코비안 행렬은 함수의 선형 근사를 나타내며, 점근적으로
f(x + Δx) ≈ f(x) + J(f)(x) · Δx 로 표현된다.
- 정사각 행렬의 경우, 행렬식(det J)을 야코비안(Jacobian determinant)이라 하며, 변수 변환 시 부피 요소의 스케일 변화를 나타낸다.
- 야코비안은 연쇄법칙(chain rule)을 행렬 형태로 표현할 수 있게 한다. 즉, 합성 함수 g(f(x))의 도함수는 J(g∘f)(x) = J(g)(f(x)) · J(f)(x)로 주어진다.
응용[편집 | 원본 편집]
- 변수 변환 : 다중 적분에서 변수 변환 공식에 사용되며, 야코비안 행렬식이 부피 요소의 변화를 반영한다.
- 비선형 방정식 해석 : 뉴턴-랩슨 방법 등에서 근사 갱신식에 활용된다.
- 최적화 : 제약 조건 하에서의 경사와 민감도 분석에 사용된다.
- 컴퓨터 그래픽스 및 물리학 : 좌표계 변환이나 동역학 해석에서 활용된다.
- 기계학습 : 역전파(Backpropagation) 알고리즘에서 다층 함수의 도함수를 체계적으로 계산하는 데 응용된다.
같이 보기[편집 | 원본 편집]
참고 문헌[편집 | 원본 편집]
- Carl D. Meyer, Matrix Analysis and Applied Linear Algebra, SIAM.
- Jerrold E. Marsden, Anthony J. Tromba, Vector Calculus, W. H. Freeman.