요약

jkits

한국지식정보기술학회 논문지

Journal of Knowledge Information Technology and Systems

1975-7700

한국지식정보기술학회

Korea Knowledge Information Technology Society

jkits_2020_15_04_497

10.34163/jkits.2020.15.4.006

Research Article

다중선형회귀분석 기법을 이용한 고교야구투수의 방어율 예측

High-School Baseball Pitcher’s ERA(Earned Run Average) Prediction Using Multi-Variable Linear Regression Analysis Method

오

영환

Young Hwan

나사렛대학교 IT융합학부 교수 Division of IT Convergency, Korea Nazarene University

Corresponding author is with the Division of IT Convergency, Korea Nazarene University, 456 Wolbong-ro Seobuk-gu Cheonan, 31172, KOREA.

E-mail address: yhoh@kornu.ac.kr

08 2020

15 4 497 506 15 06 2020 09 07 2020 10 08 2020

2020

요약

최근에 인공 지능에 관한 연구가 활발히 진행 중이고, 학자와 연구원들이 인간을 넘어서는 인공 지능을 제작하기 위해 끊임없이 노력 중이다. 기계 학습은 수학의 논리적인 알고리즘을 이용해 각종 데이터를 학습, 분석하고 예측한다. 이 분석한 내용을 기반으로 의사 결정을 도와준다. 최종적으로 소프트웨어나 프로그램에 최적화된 알고리즘을 직접 기술해 넣는 것이 아니라 대용량의 빅데이터와 학습 알고리즘을 이용하여 IT기기 또는 전자장치 그 자체가 학습하도록 하여 실행 능력을 만드는 것을 목표로 한다. 선형 회귀는 하나 이상의 독립 변수 x와 종속 변수 y와의 선형 상관 관계를 모델링하는 회귀분석 기법으로 일반적으로 최소제곱법을 이용해 선형 회귀 모델을 정립한다. 다중 선형회귀분석은 독립 변수가 2개 이상인 회귀 모형을 분석 대상으로 한다. 단순 회귀분석은 하나의 독립 변수를 가지고 추정함으로써 편의현상(bias)를 가지고 올 수 있다. 야구선수의 투수 능력은 속구 스피드, 제구, 집중력이 좌우한다. 특히 투수의 스탯 중 WHIP, 피안타율, 탈삼진율은 투수의 중요한 척도가 된다. 본 논문에서는 투수의 WHIP, 피안타율, 탈삼진율을 학습데이터로 하여 방어율을 예측한다. 이를 토대로 하여 특정 투수가 프로에 지명되는 지를 예견할 수 있다.

ABSTRACT

Recently, studies on artificial intelligence has been actively conducted, and scholars and researchers are constantly trying to create artificial intelligence beyond humans. Machine learning uses mathematics' logical algorithms to learn, analyze and predict various data. It assists decision making based on this analysis. The goal is not to directly write algorithms optimized for software or programs, but to create execution capabilities by letting IT devices or electronic devices themselves learn using large-scale big data and learning algorithms. Linear regression is a regression analysis method that models the linear correlation between one or more independent variables(x) and a dependent variable(y). Generally, a linear regression model is established using a least squares method. Multiple linear regression analysis targets egression models with two or more independent variables. Simple regression analysis can bring bias by estimating with only one independent variable. A baseball player's pitching ability depends on his speed, ball and concentration. In particular, among pitchers' stats, WHIP, H/9(Hits Runs Allowed Per 9 Innings Pitched) and K/9(Strikeout Per 9 Innings Pitched) are important measures of pitching. In this paper, the ERA(Earned Run Average) is predicted using the pitcher's WHIP, H/9 and K/9 as training data. We can predict whether a specific pitcher will be nominated for a professional baseball player or not.

K E Y W O R D S Artificial intelligence Machine-learning Multi-variable linear regression Gradient descent algorithm Tensorflow

1. 서 론

인공지능(Artificial intelligence)은 인간과 유사한 지능을 갖고 있는 기능을 갖춘 컴퓨팅 시스템이며, 인간의 유사 지능을 기계와 가전 등에 인공적으로 설계와 구현을 한 것이다[1]. 지난 수십 년 동안 인공 지능에 관한 연구와 개발이 활발히 진행 중이고, 학자와 연구원들은 사람을 넘어서는 인공 지능 시스템을 제작하기 위해 끊임없이 노력 중이다.

머신 러닝(Machine learning)은 수학의 논리적인 알고리즘을 이용해 데이터를 학습, 분석하고 예측한다. 이 분석한 내용을 기반으로 의사 결정을 도와준다. 최종적으로는 소프트웨어나 프로그램에 최적화된 알고리즘을 직접 기술해 넣는 것이 아니라 대용량의 빅데이터(Big data)와 학습 알고리즘을 이용하여 IT기기나 전자장치 그 자체가 학습하도록 하여 실행 능력을 만드는 것을 목표로 한다[2]. 최근에는 인간의 뇌가 가진 인지적이고 생물학적 특징, 뉴런 구조를 바탕으로 하는 인공 신경망(Artificial neural network) 연구에 상당한 노력을 하고 있다. 딥 러닝(Deep learning)은 사람의 뇌의 뉴런과 비슷한 정보 I/O 알고리즘을 가져와 방대한 양의 데이터를 저장하고 학습하여 기존의 인공 신경망 시스템에서 발전한 인공 지능 기술이다[3]. 이제 딥 러닝은 현실 세계를 감지하고 분석하는 인공 지능을 개발하는 데 가장 인기 있는 기술로 거듭나고 있다[4].

야구 경기는 투수(Pitcher)와 포수(Catcher)가 각각 야구공을 송구하고 포구하는 것으로부터 시작되며 이 경우가 야구 경기에서 차지하는 비중이 가장 크다[5]. 특히, 투수는 훌륭한 재목으로 성장하기 위해서 투구 스피드(Ball speed)와 제구(Ball control) 그리고 투구 밸런스(Pitching balance)가 좋아야 한다. 야구의 다양한 통계값 중에서 투수와 연관된 스탯(STAT)은 다음과 같다[6].

- ERA(Earned Run Average, 평균자책점) : 투수가 9이닝당 내준 평균 자책점(Earned Runs)

- WHIP(Walks plus Hits divided by Innings Pitched, 안타+볼넷 허용률) : 투수가 1이닝당 허용한 안타수와 볼넷수

- K/9(Strikeout Per 9 Innings Pitched, 탈삼진율): 투수가 9이닝당 잡은 삼진 개수

- H/9(Hits Runs Allowed Per 9 Innings Pitched, 피안타율) : 투수가 9이닝 당 허용한 피안타 개수

- BB/9(Base on Balls Per 9 Innings Pitched) : 투수가 9이닝 당 볼넷 개수

- K/BB(탈삼진/볼넷) : 삼진 개수를 4구 개수로 나눈 값, 2.0 이상이면 좋은 투수로 판단하고 3.0 이상이면 최고급 투수로 본다.

투수의 투구스피드가 약 140km인 경우 투수판으로부터 홈플레이트까지의 시간은 약 0.4∼0.5초이다[7]. 재능이 있고 인기있는 투수로 성장하기 위한 중요한 요소는 투구의 스피드이지만, 투수의 다양한 STAT에서도 뛰어 나야된다. 고교야구 투수의 통계 값은 1차와 2차 드래프트(Draft)에서 고교야구 선수가 프로야구로 지명되는 중요한 지표이다. 또한 프로야구 선수가 되는 객관적인 데이터이다. 다음 <그림 1>은 대한야구소프트볼협회(Korea Baseball Softball Association)에서 발췌한 고교야구 투수들의 각종 데이터의 예이다.

그림 1. 고교야구 투수 데이터

Figure 1. Pitcher data of High-school baseball

2020년 현재 대한야구소프트볼협회에 등록된 고교야구는 81개 팀이 있으며 황금사자기, 청룡기와 같은 전국대회 왕중왕전과 고교야구 전, 후반기 주말리그 등 많은 경기를 소화하고 있다. 고교야 구 주말리그제 는 KBSA(Korea Baseball-Softball Association)가 2010년대 초반부터 시행한 제도로서 공부도 하는 우수 엘리트 학생 스포츠라는 생각을 가지고, 전국을 크게 10개 정도의 권역으로 나눠 7-8개 팀을 배정하여 주중을 제외한 주말리그로 열리고 있다[8]. 고교야구 선수는 KBO(Korea Baseball Organization) 프로선수들과 체력, 체격, 기술적인 면에서 커다란 간격이 있기 때문에 이를 줄이기 위한 여러 노력을 하고 있다. 고교 야구 선수가 프로야구 선수가 되는 지명제도(드래프트)는 엘리트 야구 선수로 성장하는 중요한 기회가 된다. 통상적으로 매년 6월과 8월에 각각 1차 드래프트와 2차 드래프트가 개최된다. 이 때 10개의 프로야구 팀은 고교야구 선수의 체격, 성장가능성 등을 주요 골자로 하여 지명을 하지만 2~3년 동안 그들이 이루어놓은 각종 지표(야구 스탯)을 무시할 수가 없다.이는 대한야구소프트볼협회 데이터베이스 서버에 전부 저장되어 각 프로팀의 스카우터와 다양한 사용자에게 제공된다.

좋은 투수로 성장하기 위해서는 학생선수가 던질 수 있는 구종에 대한 구속, 제구 그리고 투구밸런스가 중요하다. 이를 통하여 야구 경기에서 좋은 성적을 낼 수 있다. 투수의 평균자책점, WHIP, 피안타율, 탈삼진율, 방어율은 대표적인 투수의 척도지표이다[9]. 이를 통하여 훌륭한 프로야구 선수가 될 수 있는 지를 가늠하여 볼 수 있다. 또한 프로 스카우터가 이를 바탕으로 드래프트를 통하여 프로야구 신인선수로 발탁한다. 투수의 WHIP, 피안타율, 탈삼진율, 방어율은 서로 연관되어 있으며, 본 논문에서를 이를 학습데이터로 선정하여 다른 투수의 성적을 예측할 수 있다.

본 논문에서는 텐서플로우(Tensorflow)을 이용하여 고등학교 투수의 방어율을 예측하기 위한 다중선형회귀분석기법을 연구한다. 이를 위하여 투수의 WHIP, 피안타율, 탈삼진율을 학습데이터로 이용하며 예측 기법을 구현하고 성능을 평가한다.

본 논문의 구성은 다음과 같다. 제 2장에서는 관련 연구와 제 3장에서는 학습데이터, 그리고 제 4장에서는 예측 모델을 기술한다. 제 5장에서는 구현과 실험 결과를 논의한다. 마지막으로 제 6장에서 결론을 기술한다.

2. 관련 연구 2.1 다중 선형회귀 분석

선형회귀 분석(Linear Regression Analysis)을 위해서는 우선 선형회귀 모델(Linear Regression Model)을 작성해야 한다. 이 모델은 수학식으로 표현된 함수를 의미하며, 하나 이상의 독립 변수(Independent Variable)와 독립변수(Dependent Variable)와의 상관관계를 의미한다[10]. 선형회귀분석은 종속변수 y, 독립변수 x, 상수항 b 사이의 관계를 모델링하는 방법이다. 이 때 여러 개의 독립 변수를 다루는 경우를 다중 선형회귀(Multiple Linear Regression)이라고 한다[11].

2.2 텐서플로우

텐서플로우는 2011년에 구글(Google)이 연구개발을 시작하여 오픈 소스(Open source)로 공개한 ML 라이브러리로 기계 학습과 딥 러닝 분야를 전문가와 일반인들이 이용하기 쉽도록 다양한 기능들을 제공한다[12]. 최근에 알파고(Alphago)와 함께 전 세계적으로 관심이 높아진 추세이다. 또한 높은 수준의 프로그래밍 언어로 알려진 파이썬(Python)을 활용하여 연산프로세싱을 처리할 수 있다[13].

그림 2. 텐서플로우

Figure 2. Tensorflow

3. 학습데이터

고교야구 선수나 프로야구 선수 중 투수 능력은 직구 스피드(Straight speed), 제구(Ball control), 투구 밸런스(Pitching balance)가 가장 중요하다. 특히 투수의 스탯(STAT) 중 WHIP, 피안타율, 탈삼진율은 투수의 중요한 척도가 된다. 이 밖에 평균자책점, K/BB 등 다양하다. 본 연구에서는 투수의 WHIP, 피안타율, 탈삼진율을 학습데이터(Training data)로 하여 방어율을 예측한다. 이를 토대로 하여 특정 투수가 프로에 지명되는 지를 예측할 수 있다[14].

본 장에서는 고교야구 투수의 WHIP, 피안타율, 탈삼진율을 가지고 텐서플로우를 이용하여 예측모델을 산정한다. 이를 위하여 먼저 학습데이터를 결정하고 최소제곱법(Least squares method)을 이용하여 학습률(Learning rate)을 결정한다[15].

3.1 학습데이터

본 실험을 위하여 대한야구소프트볼협회 홈페이지 자료실에서 2019년 고등학교 야구에서 투수로써 경기에 임했던 KBO리그에 프로로 선발된 투수 9명을 임의로 선택하여 표본 자료를 샘플링하였다.

학습은 지도 학습(Supervised learning)과 비지도 학습(Unsupervised learning)으로 나뉜다. 지도 학습은 미리 정해진 데이터를 이용하여 학습을 한다. 이 때 기초가 되는 데이터를 학습 데이터라고 한다[16]. 본 장에서는 종속변수 x1, x2, x3로부터 독립변수 y를 예측 한다. 다음 <표 1>는 독립 변수와 종속 변수를 보여 준다.

표 1. 독립변수와 종속변수

Table 1. Independent and dependent variables

x1(WHIP)	x2(피안타율)	x3(탈삼진율)	y(방어율)
1.00	0.229	10.31	2.63
0.98	0.209	11.25	3.54
1.14	0.213	6.75	3.54
1.53	0.159	10.08	3.20
1.11	0.181	11.06	2.57
1.47	0.256	12.56	3.35
1.40	0.156	10.8	2.10
1.64	0.179	9.82	4.64
1.56	0.197	7.88	2.81

여기에서 x1 데이터는 WHIP, x2 데이터는 피안타율, x3 데이터는 탈삼진율 그리고 y 데이터는 방어율이다.

3.2 산점도

텐서플로우의 matpotlib을 이용하면 학습데이터의 산점도(scatter plot)를 표현할 수 있다. 아래 <그림 3>은 학습데이터에 대한 데이터 프레임 작성에 대한 것이다. 아래 코드를 실행하면 아래와 같이 산점도 그래프가 그려진다. 코드의 내용은 다음과 같다. 먼저 Matplotlib를 import한다. Matplotlib는 파이썬(Python)에서 그래프를 그릴 수 있는 라이브러리다. plt.plot()를 이용하여 scatter 그래프를 그릴 것을 지정한다. plt.plot(x축 데이터, y축 데이터)가 기본 문법이다.

그림 3. 학습데이터와 데이터프레임

Figure 3. Training data and Data frame

위의 <표 1>를 산점도 그래프로 나타내면 다음 <그림 4>부터 <그림 6>까지이다.

그림 4. x1(WHIP)와 y(방어율)

Figure 4. x1(WHIP) and y(ERA)

그림 5. x2(피안타율)와 y(방어율)

Figure 5. x2(AVG) and y(ERA)

그림 6. x3(탈삼진율)와 y(방어율)

Figure 6. x3(K/9) and y(ERA)

4. 다중 선형회귀분석

본 장에서는 다중 선형회귀분석에 대한 가설 방정식과 최소 제곱법 그리고, 경사 하강법을 설명한다.

4.1 가설 방정식

다중 선형회귀분석은 두 개 이상의 독립 변수들과 하나의 종속변수의 상관관계를 분석하는 기법으로 단순 선형회귀의 확장이다. 3.1절에서 언급한 WHIP, 피안타율, 탈삼진율, 방어율 학습데이터를 가지고 학습을 진행하면 여러 개의 독립변수로 결과값을 예측하기 위한 가설을 매트릭스 곱셈 연산으로 표현할 수 있다.

HX=XWx1 x2 x3·w1w2w3=x1w1+x2w2+x3w3

즉, 단순 선형회귀분석에서 이용되었던 가설에 x 값을 n개 추가하여 위의 식으로 가설을 만들 수 있다. 본 논문에서는 독립 변수 x의 개수가 3개이므로 이를 수식으로 표현하면 아래와 같다.

Hx1,x2,x3=ω1x1+ω2x2+ω3x3+b

그리고 독립 변수가 추가되어 변경된 가설을 이용하면 비용 함수(cost function)식은 가설 부분만 변경하면 된다. 이러한 학습 데이터를 바탕으로 비용함수를 만들어 낸다면 투수의 WHIP, 피안타율, 탈삼진율을 가지고 투수의 방어율을 예측할 수 있다.

costW,b=1m∑I=1mHx1i,x2i,x3i-yi2

4.2 최소 제곱법

본 연구에서는 가장 적합한 가설을 구하기 위하여 여러 개의 가설 중에서 최소 제곱법을 이용한다. 즉, 가설과 학습데이터 사이에 오차가 작다면 적합한 가설이 된다.

H(x) - y가 실제 데이터와 가설 데이터 간의 차이 값이 된다. 이 데이터는 양수 또는 음수값이 둘 다 나오기 때문에 아래와 같이 제곱을 해준다.

Hx-y2

m개의 학습데이터가 있을 때, 여러 개의 학습데이터에서 그려진 직선은 예측 값(H(x)) 과 학습데이터 값(y)의 차이를 제곱한 값의 평균이다.

costW,b=1m∑i=1mHxi-yi2

즉, 선형회귀는 여러 개의 학습데이터가 주어졌을 때, 비용 값을 제일 적게 하는 가설의 매개변수(W, b)를 찾는 알고리즘이다. 즉, 비용을 최소화하는 W와 b의 해를 구하는 것이 선형회귀 분석의 목적이 된다. 이 경우 일반적으로 경사 하강 알고리즘(Gradient descent algorithm)을 이용하여 최저값을 구한다.

4.3 경사 하강법

경사 하강법은 함수의 기울기를 이용하여 그래프 값의 차이값을 비교한 후 제일 적은 방향으로 이동시키는 방법이다.

costW=12m∑i=1mHxi-yi2

W :=W-α∂∂WcostW

그림 7. 경사 하강법

Figure 7. Gradient descent method

즉, 미분은 함수의 순간 변화율을 뜻하며 한 점에서의 기울기를 의미한다. 임의의 점에서 미분값을 구하면 그래프(가설)의 기울기를 구할 수 있다. 경사 하강법에서 미분 값이 제로값을 찾는 경우 기울기가 양수와 음수를 번갈아 반복됨으로 기울기의 부호를 변경할 때 이동거리를 정해주는 것이 중요하다. 이를 학습률이라고 한다.

5. 구현 및 실험결과 5.1 텐서플로우를 이용한 다중선형회귀분석

본 논문에서는 텐서플로우를 이용하여 데이터 셋 형태의 다중선형회귀분석 모델을 작성한다[17]. 먼저 학습 데이터를 가지고 오고 여기에 맞는 최적의 직선을 텐서플로우를 이용하여 실행한다. 행렬을 이용하지 않을 때는 데이터 셋을 각각 한 개씩 만들어 초기화 한다. 변수 또한 데이터 셋에 맞춰 w1, w2, w3 그리고 x1, x2, x3 각각 선언해 주어야 한다.

<그림 8>에서는 투수의 WHIP, 피안타율, 탈삼진율을 학습 데이터로 이용하여 데이터 셋으로 지정한다. 그 다음에 w1, w2, w3과 b을 지정하여 학습을 위해 랜덤 값을 할당한다. 텐서플로우는 가중치와 바이어스에 해당하는 변수를 이용한다. 또한 그값들이 자동으로 조절하게 하며, 비용함수가 최소화가 되도록 가중치와 바이어스를 조정한다.

그림 8. 학습데이터 정의

Figure 8. Definition of training data

다음 <그림 9>는 비용 함수를 구하기 위하여 가설 데이터와 학습 데이터의 절대값의 제곱의 합을 구해 데이터의 개수만큼 나누도록 한다. 이를 위하여 텐서플로우의 tf.reduce_mean(tf.square(...)) 함수를 이용한다. 4.3에서 기술한 바와 같이 텐서플로우는 비용값을 최소화하기 위해 최적화 알고리즘인 경사 하강법을 활용한다. 여기에서는 학습도를 1e-5로 하여 경사 하강법 알고리즘을 실행한다.

그림 9. 가설과 비용함수

Figure 9. Hypothesis and cost function

다음 <그림 10>는 텐서플로우의 전역변수값을 초기화하기 위하여 global_variables_initializer() 함수를 이용한다. 본 연구에서는 최적화를 위하여 2000번을 수행하여 학습을 진행하였다.

그림 10. 세션 생성과 최적화

Figure 10. Session creation and optimization

5.2 실행 결과

선형회귀분석을 위한 학습을 실행하면 cost의 값이 점점 최소화되고 가설함수 h = w1*x1 + w2*x2 + w3*x3 + b를 계산하여 실 데이터값과 학습으로 얻어진 데이터 값을 비교하게 된다. w1, w2, w3 값과 b의 값에 랜덤 값을 주게 되고, 학습모델로 봤을 때 이 값들이 수렴하는지 지켜보면 된다. 그 결과 값으로 각 열은 트레이닝 횟수, cost, w1, w2, w3, b의 값을 나타낸다. 다음 <그림 11>은 실행 결과를 나타낸다.

그림 11. 실험 결과

Figure 11. Experiment results

학습 데이터를 이용한 다중 선형회귀분석을 통하여 한 투수의 x1(WHIP)=0.78, x2(피안타율)=0.134, x3(탈삼진율)=13.56 인 경우, y(방어율)은 2.8829074이고 또 다른 투수의 x1(WHIP)=2.34, x2(피안타율)=0.286, x3(탈삼진율)=7.45인 경우 y(방어율)은 4.126579로 예측할 수 있다. 이를 토대로 하여 특정 투수의 우수성을 볼 수 있다.

6. 결 론

본 논문에서는 고등학교 투수의 방어율을 예측하기 위한 다중선형회귀 분석기법을 연구하였다. 이를 위하여 딥 러닝 프레임워크인 텐서플로우를 이용하며 다중선형회귀 예측 모델을 설계와 구현하고 성능을 평가하였다. 투수의 WHIP, 피안타율과 탈삼진율은 프로야구의 지명을 위한 중요한 요소들이다. 또한 투수의 방어율은 투수의 STAT 중 여러 통계값과 밀접한 관계가 있다. 본 연구에서는 투수의 WHIP, 피안타율과 탈삼진율 그리고 방어율에 대한 학습데이터를 생성하고 최적화 알고리즘인 경사 하강법을 이용하여 다중 선형회귀분석을 수행하였다. 이를 통하여 고교야구 선수에 대한 평가와 지명(드래프트)에 대해서 도움을 준다. 본 연구의 한계점으로는 경사 하강법에서 학습률에 대한 기준점을 찾기가 어렵다는 사실이다. 학습률이 낮으면 천천이 가는 대신 최소값 근처에서 안정작으로 수렴할 수 있지만, 학습률이 높은 경우 최소값 근처에서 발산하는 현상(Oscillation)이 나타날 수 있어 어려움이 있었다. 추후 연구로는 고교야구 투수의 성적(방어율, 피안타율, 삼진율)에 따른 프로야구 지명 예측에 대한 로지스틱 회귀(Logistic regression) 분석을 계속할 예정이다.

References [1]

Simari

Rahwan

2009 Argumentation in artificial intelligence Springer Publishing Company

[2]

Nilsson

1998 Introduction to machine learning CA

Robotics Laboratory, Department of Computer Science, Stanford University

[3]

Nielsen

2016 May Neural Networks and Deep Learning http://neuralnetworksanddeeplearning.com/

[4]

Huang

Liu

Maaten

Weinberger

2017 Jul.

Densely connected convolutional networks

In Proceeding of IEEE Conf. Computer Vision Pattern Recognition

Honolulu, USA

47004708

10.1109/CVPR.2017.243

[5]

Lee

Y-J.

Kim

J-T.

2002

The kinematic analysis of the pitching motion for the straight and curve ball

Journal of The Korean Society of Sports Biomechanics 122 109130

10.5103/KJSB.2002.12.2.109

[6]

Baseball Reference https://www.baseball-reference.com/, Apr. 2020

[7]

Whiteley

2007

Baseball throwing mechanics as they relate to pathology and performance – A review

Journal of Sports Science and Medicine 6 120

[8]

2019 June Korea Baseball Softball Association http://www.korea-baseball.com/

[9]

2018 May FanGraphs Baseball | Baseball Statistics and Analysis http://https://www.fangraphs.com/

[10]

Peng

C. J.

Lee

K. L.

Ingersoll

G. M.

2002

An introduction to logistic regression analysis and reporting

The Journal of Educational Research 961 115

10.1080/00220670209598786

[11]

2017 May Simple and Multiple Linear Regression in Python https://towardsdatascience.com/simple-and-multiple-linear-regression-in-python-c928425168f9

[12]

Han

E. S.

2020

A Study on the application of tensorflow to determine the correctional distance

Journal of Knowledge Information Technology and Systems 153 323329

10.34163/jkits.2020.15.3.002

[13]

2018 Jun. Tesorflow Tutorials https://gist.github.com/haje01/202ac276bace4b25dd3f

[14]

Y. H.

2019

High-school baseball Pitcher’s pitching speed prediction using linear regression analysis method

Journal of Knowledge Information Technology and Systems 144 381390

10.34163/jkits.2019.14.4.007

[15]

Miller

S. J.

2006 The method of least squares Rhode Island

Mathematics Department, Brown University

[16]

Dougherty

Kohavi

Sahami

1995

Supervised and unsupervised discretization of continuous features

Proceeding of the Twelfth International Conference on Machine Learning

194202

10.1016/B978-1-55860-377-6.50032-3

[17]

2019 June Tensorflow https://www.tensorflow.org/

감사의 글

본 논문은 2020년 나사렛대학교 학술연구비 지원에 의해 연구되었음

Young Hwan Oh received the bachelor’s degree in the Department of Computer Engineering from the Inha University in 1991. He received the M.S. degree and the Ph.D. degree in the Department of Computer Science and Engineering from Inha University in 1997 and 2001, respectively. From 1992 to 1994, he was a researcher at Korea Power Corporation. He has been a professor in the Department of Information and Communication at Korea Nazarene University since 2002. His current research interests include artificial intelligence, big data, database system. He is a member of the KKITS.

E-mail address: yhoh@kornu.ac.kr