2차 결제하기(클릭)
위의 2차 결제하기 버튼을
클릭해주세요.
2차 결제 미진행시 배송료가
추가 결제될 수 있습니다.
기출문제복원홈>커뮤니티>커뮤니티>기출문제복원
제목 | [2023년 10월 1일 시행] 제5회 빅데이터분석기사 필기 복원문제 | 등록일 | 2022-10-29 |
---|---|---|---|
10월 1일에 진행되었던 시험문제에 대한 복원문제를 공개합니다!! 복원이 안된 부분에 대해서는 댓글을 달아주신다면 바로 적용해드리겠습니다^^ 시험을 보신 여러분에게 도움이 되시길 바랍니다!!
[1과목 - 빅데이터 분석기획] 1. 빅데이터 단계별 프로세스 중 WBS 작성 단계로 맞는 것은? 정답 : ③ 프로젝트 정의 및 계획 수립
2. 원천데이터를 이해하고, 데이터를 수집하는 단계는?(복원요청) ① 복원요청 ② 데이터 이해 ③ 데이터 분석 ④ 복원요청 정답 : 복원요청
3. 인공지능, 머신러닝, 딥러닝 포함관계 중 옳은 것은? 정답 : ④ 인공지능 > 머신러닝 > 딥러닝
4. 복원요청 정답 : 복원요청
5. 빅데이터의 수집 – 저장 – 처리 – 분석 – 표현의 단계 중 저장에 사용하는 도구가 아닌 것은? 정답 : ① 텍스트 마이닝
6. 데이터 품질 진단 절차에서 데이터를 측정하고 분석하는 과정을 하는 절차는? 정답 : ② 데이터 측정
7. 개인정보에 대해 옳지 않은 것은? 정답 : ③ 법이 개정된 후 가명처리로 변경되었다
8. 다음 중 설명하는 원자료 (raw data) 에 대해 알맞은 것은? - 0 ~ 100 까지의 양수이다 - 최대값과 최소값의 차이가 크다 정답 : ② 자연로그 변환
9. 형 데이터와 같이 테이블의 행과 열로 구조화되어 있지는 않으나 스키마 및 메타데이터 특성을 가지고 있는 것은? 정답 : ② 반정형 데이터
10. 데이터 수집 방식 및 기술인 것은? 정답 : ① API
11. 총계 추정법 단점 중 틀린 것 고르시오. ① 복원요청 ② 복원요청 ③ 비식별이 불가능하다.(복원요청) ④ 복원요청 정답 : 복원요청
12. 아래 설명에 해당하는데이터 계층 플랫폼에 맞는 것을 고르시오. - 자원 관리 모듈~ 예시 정답 : ① 인프라스트럭쳐 플랫폼
13. 데이터 수집 기법 연결 중 틀린 것은? 정답 : ③ ftp – 웹로그
14. 개인정보 비식별화 조치에 대한 설명 중 틀린 것은? 정답 : ③ 범주화 : 주요 식별 정보 일부 삭제
15. 관계형 데이터베이스에서 하둡기반으로 전환하려고 하는데 이를 누가하는지? 정답 : ③ 데이터 아키텍트 or ② 데이터 엔지니어(복원요청)
16. 복원요청 정답 : 복원요청
17. 복원요청 ① 브레인스토밍 : 두개의 차이점을 비교한다.(복원요청) ② 인터뷰 : 다수의 사람들에게 질문지를 배포한다.(복원요청) ③ 포커스그룹인터뷰 : (복원요청) ④ 스캠퍼 : 이해관계자와 이야기한다.(복원요청) 정답 : ③ 포커스그룹인터뷰 : (복원요청)
18. 복원요청 정답 : 복원요청
19. 복원요청 정답 : 복원요청
20. Crisp-DM의 분석절차의 순서는? 정답 : ① 비즈니스 이해 -> 데이터 이해 -> 데이터 준비 -> 모델링 -> 평가 -> 전개
[2과목 - 빅데이터 탐색] 21. 시험 응시자 연령 모평균 신뢰구간 추정 문제 - 모표준편차는 11, 표본 추출된 121명의 평균 연령은 35세임. 표본정규분포표 주어짐. 95% 신뢰수준의 구간 추정? 정답 : ② 33.04 ~ 36.96
22. 모집단의 표준편차를 알지 못하는 평균차이 검정 분포는? 정답 : ③ 자유도가 n-1 인 t분포
23. 클래스불균형 해결방안으로 적당하지 않은 것은? 정답 : ④ 정규화
24. 표본 크기가 커짐에 따른 이점이 아닌 것은? 정답 : ② 표본 크기와 관계없이 표본 평균의 기댓값은 모평균과 같음
25. 상자수염그림과 이상치에 대한 설명으로 적합하지 않은 것은? 정답 : ② 수염은 IQL값의 1.5배 내지 3배 멀리 떨어진 데이터까지 연결되어 있음
26. 신약개발 전후 약을 무작위 20명을 추출하여 투약 후, 결과를 검정하는 방법은? 정답 : ③ 대응이 있는 모평균 차이에 - 한쪽 검정
27. 통제기법내용으로 옳지 않은 것은? 정답 : ① 제1사분위는 제75백분위수이다.
28. 주성분분석에 대한 설명으로 옳지 않은 것은? 정답 : ② 주성분분석은 표본의 수가 변수의 수보다 클때 사용할수 없다.
29. 특정사건의 수를 확률변수로 갖는 확률분포로 적절한 것은? 정답 : ② 포아송분포
30. 피어슨 상관계수표이다. 각각 상관계수를 구했을 때, 다음 중복제거단계 시 진행할 일은 무엇인가?(0을 제외한 숫자는 임의) 정답 : ② A 또는 C를 제거 31. 어떤 지역의 소득 분포를 조사하였더니 아래 그림과 같은 분포가 나타났다. 조사대상 중 일부 응답값이 누락되어 대치값으로 대치하고자 할 때 어떤 값으로 대치하는 것이 가장 적절한가? 정답 : ① 중앙값
32. 다음은 공분산에 대한 설명이다. 적절하지 않은 것은? ① 복원요청 ② A와 B가 독립일 때 Cov(a,b) = 0 이다.(복원요청) ③ Cov(a,b) = 0 이면 두 변수 a,b는 항상 독립적이다. (복원요청) ④ 복원요청 정답 : ③ Cov(a,b) = 0 이면 두 변수 a,b는 항상 독립적이다.
33. 모집단에서 정규분포를 따르는 X를 추출한다. 표본 4개 (X1, X2, X3, X4)에 대한 설명으로 틀린것은? 정답 : ④ X1,X2는 종속관계이다
34. 인코딩 설명 가장 잘못된 것은? 정답 : ④ target 인코딩, 표준편차
35. 다음 그래프의 상관계수로 맞는것은? 정답 : ① - 0.9
36. 아래 그림과 같이 데이터를 시각적으로 표현한 것을 무엇이라고 하는가?(그림 참조) 정답 : ④ 산점도
37. 복원요청 정답 : 복원요청
38. 복원요청 정답 : 복원요청
39. 복원요청 정답 : 복원요청
40. 복원요청 정답 : 복원요청
[3과목 - 빅데이터 모델링] 41. 텍스트를 벡터로 바꾸는 방법으로 옳지 않은 것은? 정답 : ④ pos tagging
42. 미래를 예측하는 모형으로 옳은 것은? 정답 : Predictive Analysis(복원요청)
43. 앙상블기법으로 표현할 때 베이스모델들의 독립성을 촉진시키는 방법으로 옳지 않은 것은? 정답 : ② test 데이터셋을 다양하게 한다
44. 변수선택법으로 옳지 않은 것은? 정답 : ② 차수선택법
45. 주요인자분석에 대해 옳지 않은 것은? ① 인자들간의 상관관계를 표현 ② 특정 현상에 영향을 미치는 중요한 인자 ③ 복원요청 ④ 복원요청 정답 : 복원요청
46. 기온별 변화를 잘 나타낼 수 있는 것은? 정답 : ④ 시계열분석
47. 모델정의 고려사항 중 틀린 설명은? 정답 : ② 복잡한 모델이 단순한 모델보다 과적합관련 옳은 설명하고 항상좋다
48. 연관 규칙의 측정지표로써 A을 샀을 때 항목 A와 항목 B를 동시에 포함하는 거래의 비율을 평가하는 지표는? 정답 : ② 신뢰도
정답 : ② 2
50. 아래 표의 내용으로 옳은 설명은? ① A약 암환자 생존율은 50%, B약 암환자 생존율은 40%이다.( 복원요청) ② 조기암 생존율은 A약보다 B약이 높다.(복원요청) ③ 말기암 생존율은 A약이 B약보다 높다.(복원요청) ④ A약이 B약보다 효과적이다.(복원요청) 정답 : ① A약 암환자 생존율은 50%, B약 암환자 생존율은 40%이다.( 복원요청)
51. ARIMA에 대한 설명 중 옳지 않은 것은? 정답 : ① 백색잡음 독립적이지 않다.
52. 복원요청 정답 : 복원요청
53. 복원요청 정답 : 복원요청
54. 복원요청 정답 : 복원요청
55. 복원요청 정답 : 복원요청
56. 자료유형에 따라 사용된 통계분석방법으로 적절하지 않은 것은? ① T-검정은 수치형 종속변수와 2개 범주의 독립변수를 사용하여 분석하는 방법이다. ② 로직모형은 범주형 종속변수와 범주형 및 수치형 독립변수를 사용하여 분석하는 방법이다. ③ 카이제곱(X²) 검정은 범주형 종속변수와 범주형 독립변수를 이사용하여 분석하는 방법이다. ④ 공분산분석(ANOVA)는 종속변수가 범주형, 독립변수가 연속형인 방법이다.(복원요청) 정답 : ④ 공분산분석(ANOVA)는 종속변수가 범주형, 독립변수가 연속형인 방법이다.(복원요청)
57. 순환신경망에서 발생하는 기울기 소실문제와 기울기 폭발문제에 대해서 올바르게 설명한 것은? 정답 : ② 기울기 소실문제란 역전파 알고리즘으로 가중치를 갱신하면서 학습률이 급하게 감소하여 학습률이 0에 수렴하는 문제이다.
58. 통계기반 분석모형에 대해서 옳은 것은? 정답 : ③ 현황분석이란 현재의 분석결과를 이용하여 미래를 예측하는데 사용하는 방법이다.
59. 회귀분석모델에 대하여 옳은 것을 고르시오. 정답 : ② 독립변수가 1개 이상이고, 종속변수와의 관계가 2차 이상일 때 다항회귀모형이라 한다.
60. 중간값을 이용한 비모수검정에 대하여 틀린 것은? 정답 : ③ 만-휘트니 U검정이란 윌콕슨의 순위합검정과 유사한 모수 양측검정이다.
[4과목 - 빅데이터 결과해석] 61. 과대적합/과소적합에 대한 설명중 옳지 않은 것은? 정답 : ③ 비선형은 선형보다 과대적합이 발생할 가능성이 적다.
62. 재현율이 60%, 정밀도가 40%일 때 F1-스코어는? 정답 : ② 0.48
63. ROC그래프 정답 : ① 민감도 특이도
64. 관계시각화 옳지 않은것은? 정답 : ② 누적
65. 빅데이터시각화 설명 옳지않은 것은? 정답 : ④ 정제 설명
66. 분석결과를 표현하는 스토리텔링 과정으로 옳지 않은 것은? 정답 : ④ 사용자별 데이터 셋 및 정보 정의
67. 일반화선형모델이 적합성 검증에 적합하지 않다고 할때 그 원인으로 올바른 것은? 정답 : ② 가다
68. 다음 중 어떤 시각화 방법인가? [지역별 상품별 비교할 때 행 열에 지역, 상품을 놓고 판매량을 셀에 색깔로 지정한다.] 정답 : ③ 히트맵
69. 인포그래픽의 장점으로 옳지 않은 것은? 정답 : ③ 패턴을 발견할 수 있다.
70. 교차검증의 역할로 옳지 않은 것은? 정답 : ④ 훈련 : 검증 : 테스트 = 2 : 3 : 5로 선택한다
71. 드롭아웃에 대한 효과로 맞는것은? 정답 : ③ 데이터증강
72. 모델평가기준으로 가장 적절하지 않은 것은? 정답 : ④ 표본의충분성
73. 다음 중 출력층을 다시 학습하는 것으로 옳은 것은?(문제 보완요청) ① 전이학습(복원요청) ② 강화학습(복원요청) ③ 지도학습(복원요청) ④ 비지도학습(복원요청) 정답 : ① 전이학습(복원요청)
74. 아래 그래프를 보고 무엇을 해결해야하는가? 정답 : ④ 클래스 불균형 해소
75.앙상블의 특징? 복원요청 정답 : 복원요청
76. 비교시각화로 옳지 않은 것은 무엇인가? 정답 : ③ 버블차트
77. 의사결정나무 분석결과 뿌리만 남는 이유로 적절한 것은 무엇인가? 정답 : ④ 충분히 변별력있는 변수가없어서
78. 기본 평가지표공식으로 옳지 않은 것은 무엇인가? 정답 : ② MSE=틀린공식 (제곱없이 출제)
79. 정규성 검증방식으로 틀린 것은 무엇인가? 정답 : ④ chi squred test
80. 혼동행렬공식 중 틀린 것은? 정답 : ④ 재현율= TN/TN+FN
|