전체 글

express server learn-express 프로젝트를 하고 express 모듈을 이용한 server를 만들어보자. npm i express npm i -D nodemon express와 편의를 위해 nodemon을 설치하자. const express = require('express'); const app = express(); app.set('port', process.env.PORT || 3000); app.get('/', (req, res) => { res.send('Hello, Express'); }); app.listen(app.get('port'), () => { console.log(app.get('port'), '번 포트에서 대기중...'); }); express 모듈을 실행해 a..
타이타닉 생존자 예측 kaggle에 있는 데이터 셋을 불러와 Tableau를 이용하여 분석해보자. 데이터 전처리를 한 뒤 모델에 학습을 시켜보자. 데이터 원본이다. 쭉 둘러보니 쓸모없는 데이터도 있는 것 같다. 성별과 나이를 분석해 봤다. 파란색이 여자, 주황색이 남자이다. 0이 죽은 사람, 1은 생존자이다. 눈에 확연히 들어오는 것은 20~30대의 남성이 여성에 비해 많이 죽었다는 것과 10~30대의 여성이 남성에 비해 많이 생존했다는 것이다. 원의 크기로 보아 남성 승객이 더 많았음을 알 수 있다. 또한 남색이 죽은 사람이고 주황색이 생존자이다. 여성은 남성에 비해 많이 탑승하지 않았지만 생존자가 죽은 사람보다 3배 많다. 그에 비해 남성은 많이 탑승하였지만 생존자가 4배 정도 적다. Pcalss를 ..
npm 세상에는 무수히 많은 자바스크립트 프로그래머가 있다. 그런 사람들이 미리 작성해놓은 코드들도 있다. 그리고 이를 공개해 놓은 코드도 많다. 우리는 이런 코드들을 잘 사용할 줄 알아야 한다. 이런 코드들이 공개되어 있는 서버인 npm을 알아보자. npm은 Node Package Manager의 약어로, 이름 그대로 노드 패키지 매니저이다. 대부분의 자바스크립트 프로그램은 패키지라는 이름으로 npm에 등록되어있고 특정 기능을 하는 패키지가 필요하면 npm에서 찾아 설치하면 된다. npm에 업로드된 노드 모듈을 패키지라고 부르며 패키지가 다른 패키지를 사용할 수도 있다. 이런 관계를 의존 관계라고 부른다. package.json 서비스에 필요한 패키지를 하나씩 추가하다 보면 어느새 패키지 수가 100개..
쿠키와 세션 클라이언트에서 보내는 요청에는 한 가지 큰 단점이 있다. 바로 누가 요청을 보내는지 모른다는 것이다. 물론 요청을 보내는 IP 주소나 브라우저의 정보를 받아올 수는 있다. 하지만 여러 컴퓨터가 공통으로 IP 주소를 가지거나, 한 컴퓨터를 여러 사람이 사용할 수도 있다. 그렇다면 로그인을 구현하여 관리하면 된다. 하지만 로그인을 구현하려면 쿠키와 세션에 대해 알고 있어야 한다. 로그인한 후에는 새로고침을 해도 로그아웃이 되지 않는다. 클라이언트가 서버에 누구인지 지속적으로 알려주고 있기 때문이다. 누구인지 기억하기 위해 서버는 요청에 대한 응답을 할 때 쿠키라는 것을 같이 보낸다. 쿠키는 유효 기간이 있으며 name=GR8와 같이 단순한 '키-값'의 쌍이다. 서버로부터 쿠키가 오면 웹 브라우저..
요청과 응답 클라이언트에서 서버로 요청(request)을 보내고, 서버에서는 요청의 내용을 읽고 처리한 뒤 클라이언트에 응답(respoense)을 보낸다. 따라서 서버에는 요청을 받는 부분과 응답을 보내는 부분이 있어야 한다. 요청과 응답은 이벤트 방식이라 생각하면 된다. 클라이언트로부터 요청이 왔을 때 어떤 작업을 수행할지 이벤트 리스너를 미리 등록해두어야 한다. const http = require('http'); http.createServer( (req, res) => { //응답 내용 }); http 서버가 있어야 웹 브라우저의 요청을 처리할 수 있다. createServer 메서드를 사용하여 콜백 함수에 요청에 대한 응답 내용을 적으면 요청이 들어올 때마다 콜백 함수가 실행된다. createS..
Level of Detail Tableau는 집계를 기본으로 한다. 따라서 전체 데이터를 모두 집계한 뒤 구분하여 데이터를 보여주는 형태이다. Excel은 반대로 각각의 row level 데이터를 가지고 원하는 항목을 집계하여 볼 수 있다. 데이터의 방향성이 정반대라고 생각하면 된다. 따라서, 태블로는 전체 데이터를 요약하고 정리하여 보는 방식에 최적화된 데이터 시각화 툴이다. 반대로 엑셀은 각각의 데이터, 원본의 데이터를 원하는 분야에 처리할 수 있는 툴이다. 태블로를 사용할 때는 전체 데이터를 어떤 depth, detail, granularity로 나누어 볼 건지 잘 결정해야 한다. 데이터를 끝까지 분기한다 할 때 어떤 필드에 의해 끝까지 분기한다 하더라도 그게 개인에 대해 일반화하면 위험할 수 있다..
연속형 VS 불연속형 연속형 데이터는 초록색 알약(Green pill)로 불연속형 데이터는 파란색 알약(Blue pill)로 표현된다. 선반에 올리면 값들이 연속적인 값들을 갖는다. 그렇다면 측정값은 연속형이고 차원은 불연속형일까?? 많은 경우가 그렇기는 하지만 100% 그렇지는 않다. 측정값 중 문자열을 갖거나 하는 값들은 불연속형 측정값이 된다. 또한 날짜는 태블로에서 기본적으로 불연속형으로 인식하고 있다. 날짜는 계층구조를 가지고 있고 이러한 값들을 펼쳐 연속형 값들로 바꿀 수 있다. 그렇다면 그래프는 연속하여 그려지게 될 것이다.
hvv_an
이미난