본문 바로가기

알고리즘

[항해 코테 챌린지] 프로그래머스 H-index

https://school.programmers.co.kr/learn/courses/30/lessons/42747#fn1

 

프로그래머스

SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프

programmers.co.kr

문제 설명

H-Index는 과학자의 생산성과 영향력을 나타내는 지표입니다. 어느 과학자의 H-Index를 나타내는 값인 h를 구하려고 합니다. 위키백과1에 따르면, H-Index는 다음과 같이 구합니다.

어떤 과학자가 발표한 논문 n편 중, h번 이상 인용된 논문이 h편 이상이고 나머지 논문이 h번 이하 인용되었다면 h의 최댓값이 이 과학자의 H-Index입니다.

어떤 과학자가 발표한 논문의 인용 횟수를 담은 배열 citations가 매개변수로 주어질 때, 이 과학자의 H-Index를 return 하도록 solution 함수를 작성해주세요.

제한사항

  • 과학자가 발표한 논문의 수는 1편 이상 1,000편 이하입니다.
  • 논문별 인용 횟수는 0 이상 10,000 이하입니다.

문항 이해

이 문제를 풀 때 무식(?)하게 풀어도 시간복잡도가 어짜피 O(10000 * 1000) 이 나올거라 미리 예상했어야 했는데, 내장함수 filter를 걸면 안될것 같아서 다른 방법으로 두 시간이나 걸려서 풀었다 ㅠㅠ

 

이 문제는 최대 10000 만회까지 인용 가능한 논문들 이라는 것이기 때문에, 나올 수 있는 h-index 의 최대치는 10000 이다.

h-index는 단순히 가장 많이 인용된 횟수만 고르면 되는 문제가 아니라, 많이 인용된것 + 꾸준히 인용된 수준을 의미한다.

 

풀이과정 1

처음엔 h-index를 배열로 두고, 각 인용 횟수에 몇개의 논문이 쓰였는지 저장했다.

3번 인용된 논문이 2건 있다면 h-index[3] = 2 이렇게 들어가게..

지금 생각해보면 이름도 잘못 지엇다 h-index 가 아니라 인용횟수 계산하는 용도인데;;

 

그러고 나서 나중에 h-index를 순회하면서, n번 이하 인용된 논문이 몇개인가, 이상 인용된 논문이 몇개인가 추려서

그걸 갯수 비교해둔 다음에, 10000 을 순회하며 조건에 맞는지 계속 돌면서 체크했다.

 

직관적이지도 않고, 변수명도 엉망... ㅠㅠ

 

def solution(citations):
    h_index = [0 for i in range(10002)]
    answer = 0
    c1 = sorted(citations, reverse=False)
    #이하, 이상 횟수
    for j in range(0, len(c1)):
        cnt = c1[j]
        h_index[cnt] += 1
    for j in range(0, 10002):
        sum1 = sum(h_index[0:j+1])
        sum2 = sum(h_index[j:10002])
        if(sum1 <= j and j <= sum2):
            answer = j
    return answer

 

 

풀이과정 2

어짜피 O(10000000) 이어도 시간초과 나진 않을것 같아서, h_index에 해당 할 수 있는 모든 범위를 돌면서, 논문 들 중 본인보다 인용횟수 작은것, 큰것을 따로 필터링 한후 갯수비교를 하도록 만들었다.

근데 지금 생각해보면 sorted가 필요없네...

def solution(citations):
    answer = 0
    c1 = sorted(citations, reverse=False)
    for j in range(0, 10000):
        item = j
        low = list(filter(lambda x: x <= item, c1))
        high = list(filter(lambda x: x >= item, c1))
        if(len(low) <= item and item <= len(high)): answer = item
    return answer

 

회고

시간복잡도를 먼저 생각하자 ^^ 삽질하기 전에...