UDF 란?User-Defined Functions (UDFs) are user-programmable routines that act on one row. (출처 스파크 Docs)즉 특정 로직을 각 행에 적용할 수 있도록 지원하는 기능이다. 더 쉽게 말하면 함수를 선언하여 Spark 데이터에 적용시키는 것이다.(map의 개념과 유사) 왜 사용할까?일반 함수를 사용하는 것과 동일하다.내장함수로 지원하지 않는 기능을 사용자가 직접 정의해두고, 편리하고 재사용이 용이하도록 사용하는 것이다 단점?우선 기본 Pyspark UDF를 가정하여 말하자면, 내장함수보다 느리다.내장함수는 기본적으로 Spark SQL 엔진 내 정의되어있고 그 안에서 실행된다.따라서 내장함수는 JVM 기반으로 실행되기 때문에 직력화, 역직..