분류 전체보기(62)
-
ML에서 특성 스케일 맞추기
Decision Tree나 Random Forest가 아닌 이상, 스케일링은 아주 중요한 작업입니다. 대부분의 ML과 최적화 알고리즘은 특성의 스케일이 비스므리 할때 훨씬 성능이 좋기 때문입니다. 뭔소리냐면, 한 속성은 char타입이고 다른 얘가 int타입이라 치면 range 범위 차이가 장난 아니게 납니다. 그걸 그대로 MSE에 가져다 박는다 치면 알고리즘은 두번째 특성의 영향을 정말로 무지막지하게 받게 될 것입니다. 해서 스케일이 다른 특성을 맞추는 방법으로는 대표적으로 Normalization과 Standardization이 있습니다. 먼저 대부분 정규화의 경우는 특성의 스케일을 [0, 1] 범위에 맞추는 것을 말하는데 - 그냥 min-max Scaling을 생각하면 편합니다. 이 친구는 정해..
2025.12.26 -
송전선과 분포정수회로
자고로 송전선은 선처럼 보이지만, 사실 물리적으로는 "아아아아아아주주주주주길게 늘어진 회로 덩어리"라서 분포정수회로로 간주해야만 한다. 여기서 분포 정수 회로란, R/L/C가 고르게 퍼져 있음을 말하며 반대로 R/L/C가 덩어리처럼 뭉쳐 있을 경우를 덩어리 회로라고 한다. 쨋든 이게 문제는 아니고, 저 빌어먹을 분포정수회로를 어떻게 해석하느냐가 문제인데. 이는 사고실험을 통해서 적당히 해석할 수 있다. 대충 송전선을 아주 짧은 길이 deltaX만큼 잘라서 보면... 이 작은 조각 하나가 나오게 된다. 그리고 여기에는 항상 네가지가 따라 붇는다. 이중 Rx는 도선 자체의 저항이고, Lx는 전류가 흐르며 생기는 자기장, Cx는 두 도선 사이의 전기정, Gx는 절연체 누설로 해석할 수 있다. 그리고 이걸 엄청..
2025.12.25 -
ML에서 누락된 데이터를 다루기
실제 데이터를 만지다 보면, 뜬금 없는 이유로 샘플에 값이 텅텅 비어 있는 경우가 있습니다. 아니면 인풋으로 1000Row를 고정해 놨는데, 정작 찍힌건 973개 밖에 없다거나 하는 식으로요...(하필 시계열 데이터여서 이걸 어떻게 해야되나 심각하게 고민했었던 기억이 있네요.) 해서 빌어먹을 누락 데이터를 어떻게 다뤄야 할지 논의좀 해보겠습니다. 일반적으로 누락된 값은 NaN(Not a Number)나 NULL과 같은 값을 사용합니다. 물론 샘플에 이게 박혀 있으면 끔찍하기 따로 없죠. 그래서 방법은 여러가지가 있는데, 일단 무식하게 1. 누락값 샘플 숙청누락 데이터를 다루는 가장 쉬운 방법입니다. df.dropna와 같은 메서드를 사용하여 쉽게 누락값이 있는 행/열(axix=0/1)을 숙청할 수 있습니..
2025.12.25 -
T형 회로와 파이형 회로의 4단자 정수
T자형 회로는 위와 같이 생겼는데, 이는 Y결선의 해석에 주로 사용된다. 문제는 이놈의 4단자 정수를 구하는 방법인데, 그냥 외우는 방법도 있지만 아래와 같은 행렬 곱들을 외우면 이해도 쉽고 암기도 쉬울 것이다. 파이형 회로의 경우에는 델타 결선과 주로 연관지을 수 있는데, 이 또한 그냥 각각의 elem에 대한 특성 행렬의 곱이라고 이해하면 편하다. 굳이 전개해서 나온 끔찍한 결과물로 외워줘야 하는지는 의문. 그리고 추가적으로, 지금까지 위에서는 전송파라미터를 사용해서 열심히 지지고 볶았다. 하지만 z파라미터를 사용해서 T형 회로/Y파라미터를 사용해서 pi형 회로를 해석할 수도 있다. 이때 z파라미터라는건 대걍 전압을 전류로 표현하는 것이라고 생각하면 된다.
2025.12.18 -
맥컬록-피츠 뉴런/퍼셉트론
AI를 설계하기 위해서 생물학적 모티브를 따와, 맥컬록과 피츠는 간소화된 뉴런의 개념을 발표했다. 이를 맥컬록-피츠 뉴런(MCP)이라고 하며, 추후 얘기하게 될 퍼셉트론이라는 개념의 모티브가 된다. 쨋든 이양반들은 뉴런을 아주 단순하게 생각해서 아래와 같은 간단한 무엇인가를 내놓게 된다. 신경세포는 Na+ K+채널을 써서 재분극이니 탈분극이니 하는 복잡한 과정이 필요한데, 다 던지고 이진 출력을 내는 간단한 논리회로로 표현해 보자.그리고 이게 발전된게 로젠블라트의 퍼셉트론이다. 이걸 좀 형식적으로 얘기하자면, 이전 신경세포에서의 가중치를 w라 치고 입력을 x라 치면 현재 신경세포에서의 출력은 가 될 것이다. 물론 현행 신경 세포도 역치값을 넘겨야지 신호를 전달하게 끔 해야 하므로, 아래와 같은 결정함..
2025.12.18 -
4단자망의 기본식
4단자 회로는 임의의 수동 선형 회로망에서 외부로 나온 단자가 4개(송신2 + 수신2)인 회로망을 말합니다. 그리고 이에 대한 분석은 크게 4개의 파라미터로 나눠 볼 수 있습니다. 왠 기괴한 파라미터가 들어가 있는걸 볼 수 있는데, 대충 1차측 V/I를 2차측 V/I로 표현하기 위한 파라미터라고 보시면 될 것 같습니다. 참고로 A는 개방 전압 이득, B는 단락 임피던스, C는 개방 어드미턴스, D는 단락 전류 이득이 되며 수식은 아래와 같습니다. 그리고 신기하게도 4단자 정수는 아래와 같은 성질을 만족하게 됩니다. 또한 대칭 4단자망일 경우 A=D가 됩니다. 직렬 임피던스 단일 소자의 경우개방전압이득은 똑같으니까 1, 단락 임피던스의 경우 Z, 개방 어드미턴스는 있을 리가 없으므로 0, 단락 전류 ..
2025.12.17