공부/Python

예제 TV 객체 추상화 상태(속성) → 상태를 동작 보다 먼저 정의 전원상태, 볼륨, 채널번호 동작(기능) 전원 켜기/끄기, 볼륨 변경하기, 채널 변경하기 TV 클래스 모델링 필드(인스턴스 변수) → 상태(속성) 표현 on, volume, channel 메소드(멤버함수) → 동작(기능) 표현 turnOn() , turnOff() , changeVolume(), changeChannel() class Tv: def __init__(self, on, ch, vol): # 생성자 - 필드 초기화 self.on = on # 필드 = 인스턴스 변수 생성 self.channel = ch self.volume = vol def print(self): # 메소드 = 멤버 함수 print(self.on, self.cha..
텍스트 데이터 텍스트 데이터 종류 구조화된 문서 : HTML, XML, CSV, JSON 파일 구조화되지 않은 문서 : 자연어로 된 텍스트 파이썬 텍스트 데이터 관련 라이브러리 기본 라이브러리에서 제공하는 문자열 처리 함수 문자열 객체(str) 메소드 string 모듈 → 문자열 상수 정의 string.ascii uppercase, string.ascii_letters, string.digits 외부 모듈 wordcloud → 워드 클라우드 생성 re → 정규 표현식 BeautifulSoup, csv, json, nltk 등 문자열 변경 불가능 자료형 → str 문자열 상수 작은 따옴표나, 따옴표로 묶음 ex) ‘test’ == “test” ex) ‘I am not “human”.’ 여러줄 문자열 상수는..
넘파이(numpy) 배열 리스트처럼 여러 개의 값들을 저장할 수 있는 자료구조 리스트는 다양한 자료형의 데이터 저장 가능 넘파이 배열은 같은 자료형의 데이터 저장 리스트보다 데이터 처리속도가 빠름 리스트는 데이터 접근을 위해 이중 참조 ⇒ 해당 이유 때문에 리스트의 처리속도가 느림 리스트는 객체 배열 넘파이 배열은 한번의 참조로 데이터 접근 가능 대량의 데이터를 빠르게 처리하려면 넘파이 배열 필요 데이터 과학, 인공지능 분야에서 넘파이 배열 사용 넘파이 배열은 ndarray 클래스로 구현 ndarray 클래스 장점 C언어에 기반한 배열 구조이므로 메모리를 적게 차지하고 속도가 빠르다. 배열과 배열 간에 수학적인 연산을 적용 배열의 모든 원소 적용되는 연산자 함수 제공 행렬 연산 고급 연산자와 풍부한 함수..
데이터 시각화**(data visualization)** 점이나 선, 막대 그래프 등의 시각적 이미지를 사용하여 데이터를 화면에 표시하는 기술 효과적인 시각화는 사용자가 데이터를 분석하고 추론하는 데 도움 데이터를 직관적으로 이해 matplotlib 데이터 시각화 도구 선 그래프, 산포도 등 다양한 그래프 그리는 용도 맷플롯립 활용 단계 pyplot 모듈 불러오기 import matplotlib.pyplot as plt plt 별칭 사용 수치 데이터 정의 → 리스트, 넘파이 배열 2차원 데이터 → x축 데이터, y축 데이터 x축, y축 데이터 개수 동일 그래프 종류 결정 선 그래프 → plot() 함수 그래프 세부 설정은 인자로 전달 → 선 색, 마크 종류, 선 두께 등 제목, y축 레이블 설정 titl..
판다스(Pandas) 데이터 분석을 위해 만들어진 파이썬 패키지(라이브러리) 엑셀처럼 행과 열로 이루어진 표 형태의 데이터를 처리 대부분의 데이터는 시계열(series)이나 표(table)의 형태 판다스 패키지 시리즈(Series) 클래스, 데이터프레임(DataFrame) 클래스 제공 cf) 넘파이 2차원 배열 행렬 matrix 형태의 데이터를 지원 데이터의 속성을 표시하는 행이나 열의 레이블이 없음 판다스 특징 다양한 형태의 데이터에 적합 이종 자료형의 열을 가지는 표 데이터 시계열 데이터 레이블을 가진 행렬 데이터 관측 통계 데이터 핵심 구조 시리즈(Series) 1차원 구조를 가지는 하나의 열 데이터 프레임(DataFrame) 복수의 열을 가지는 2차원 데이터 각각의 열을 시리즈, 시리즈가 모여 데..
AI 데이터 분석 과정 데이터 수집 오픈데이터 API, 웹 크롤링, 파일 읽기, DB 액세스 데이터 종류 정형데이터(Structure data) 미리 정해진 형식으로 구조화된 데이터 예) 엑셀 시트, RDBMS 테이블 반정형데이터(Semi-structure data) 특정한 형식에 따라 저장된 데이터이지만 정형데이터와 달리 형식에 대한 설명을 함께 제공 구조를 해석하는 파싱(일종의 번역) 과정이 필요하며 파일 형태로 저장 예) XML, JSON 비정형데이터(Unstructured data) 정해진 구조가 없이 저장된 데이터 빅데이터의 대부분을 차지 예) 텍스트, 영상, 이미지 SNS 데이터 소스 데이터가 존재하는 곳 미디어(SNS등) ,클라우드 , 웹, 사물인터넷, 데이터베이스 , 오픈 데이터/ API ..
AI 데이터 분석 과정 데이터 수집 오픈 데이터 API, 웹 크롤링, 파일 읽기, DB 엑세스 데이터 전처리 : 넘파이**,** 판다스 활용 데이터 클린징**,** 데이터 연결과 병합**,** 데이터 재구조화 데이터 분석/응용 데이터 시각화(맷플롯립 활용), 기계학습 데이터 클린징 • 편향 없이 명확하고 깨끗한 데이터를 확보하는 작업 데이터 클린징 작업 결측 데이터 처리 결측 데이터 확인 결측 데이터 대체/제거 [평균 대체법] 결측 데이터 반영 확인 이상 데이터 처리 이상 데이터 확인 이상 데이터 대체/제거 이상 데이터 처리 확인 중복 데이터 처리 중복 데이터 확인 중복 데이터 처리(유일한 1개 키만 남기고 나머지 중복 제거) 결측 데이터 결측값(Missing data) 데이터 누락값 결측값이 있는 상태..
인공지능 vs 기계학습 vs 딥러닝 인공지능 (Artificial Intelligence) 인간처럼 학습하고 추론하는 프로그램 연구 기계학습 (Machine Learning) 인공지능의 한 분야 프로그래밍 없이 스스로 학습하는 프로그램 연구 딥러닝 (Deep Learning) 기계 학습의 한 분야 인공 신경망 등을 사용하여 빅데이터로부터 학습하는 프로그램 연구 전통 프로그래밍과 머신러닝 프로그래밍 전통 프로그래밍 머신러닝 프로그래밍 머신러닝은 정답에 가까운 예측을 내는 것 기계 학습 응용 분야 기계 학습의 분류 지도 학습이 결과가 제일 좋음 지도 학습(Supervised Learning) 컴퓨터는 "교사"에 의해 주어진 예제와 정답(혹은 레이블)을 제공받음 지도학습의 목표 입력을 출력에 매핑하는 일반적인..
Future0_
'공부/Python' 카테고리의 글 목록