감사쟁이야
감사쟁이의 성장기록
감사쟁이야
  • 분류 전체보기 (130)
    • Java-Spring (0)
    • ComputerScience (0)
    • Project (64)
      • TIL, WIL (57)
      • Project Retrospect (7)
    • Problem Solving (63)
    • Book Review (1)
    • Culture & Discovery (0)
    • Daily Log (2)

블로그 메뉴

  • 홈
  • 깃허브
  • 방명록
hELLO · Designed By 정상우.
감사쟁이야

감사쟁이의 성장기록

[프로그래머스] 순위 검색 (2021 KAKAO BLIND) / python
Problem Solving

[프로그래머스] 순위 검색 (2021 KAKAO BLIND) / python

2022. 8. 12. 11:29

1. 문제 설명

 

프로그래머스

코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요.

programmers.co.kr

카카오는 하반기 경력 개발자 공개채용을 진행 중에 있으며 현재 지원서 접수와 코딩테스트가 종료되었습니다. 이번 채용에서 지원자는 지원서 작성 시 아래와 같이 4가지 항목을 반드시 선택하도록 하였습니다.

  • 코딩테스트 참여 개발언어 항목에 cpp, java, python 중 하나를 선택해야 합니다.
  • 지원 직군 항목에 backend와 frontend 중 하나를 선택해야 합니다.
  • 지원 경력구분 항목에 junior와 senior 중 하나를 선택해야 합니다.
  • 선호하는 소울푸드로 chicken과 pizza 중 하나를 선택해야 합니다.

인재영입팀에 근무하고 있는 니니즈는 코딩테스트 결과를 분석하여 채용에 참여한 개발팀들에 제공하기 위해 지원자들의 지원 조건을 선택하면 해당 조건에 맞는 지원자가 몇 명인 지 쉽게 알 수 있는 도구를 만들고 있습니다.

개발팀에서 궁금해하는 내용은 다음과 같은 형태를 갖습니다.

[조건]을 만족하는 사람 중 코딩테스트 점수를 X점 이상 받은 사람은 모두 몇 명인가?

 

[문제]

지원자가 지원서에 입력한 4가지의 정보와 획득한 코딩테스트 점수를 하나의 문자열로 구성한 값의 배열 info, 개발팀이 궁금해하는 문의조건이 문자열 형태로 담긴 배열 query가 매개변수로 주어질 때, 각 문의조건에 해당하는 사람들의 숫자를 순서대로 배열에 담아 return

 

[제한사항]

  • info 배열의 크기는 1 이상 50,000 이하입니다.
  • info 배열 각 원소의 값은 지원자가 지원서에 입력한 4가지 값과 코딩테스트 점수를 합친 "개발언어 직군 경력 소울푸드 점수" 형식입니다.
    • 개발언어는 cpp, java, python 중 하나입니다.
    • 직군은 backend, frontend 중 하나입니다.
    • 경력은 junior, senior 중 하나입니다.
    • 소울푸드는 chicken, pizza 중 하나입니다.
    • 점수는 코딩테스트 점수를 의미하며, 1 이상 100,000 이하인 자연수입니다.
    • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.
  • query 배열의 크기는 1 이상 100,000 이하입니다.
  • query의 각 문자열은 "[조건] X" 형식입니다.
    • [조건]은 "개발언어 and 직군 and 경력 and 소울푸드" 형식의 문자열입니다.
    • 언어는 cpp, java, python, - 중 하나입니다.
    • 직군은 backend, frontend, - 중 하나입니다.
    • 경력은 junior, senior, - 중 하나입니다.
    • 소울푸드는 chicken, pizza, - 중 하나입니다.
    • '-' 표시는 해당 조건을 고려하지 않겠다는 의미입니다.
    • X는 코딩테스트 점수를 의미하며 조건을 만족하는 사람 중 X점 이상 받은 사람은 모두 몇 명인지를 의미합니다.
    • 각 단어는 공백문자(스페이스 바) 하나로 구분되어 있습니다.

 

2. 풀이 전 계획과 생각

  • 힙 사용해줄 필요가 없다. 데이터를 다 저장한 후에 마지막에 sort 해주면 된다.

 

3. 풀이하면서 막혔던 점과 고민

🤔 Query가 -로 주어져 키가 한번에 매칭 되지 않고 여러번 확인해줘야 한다.  
      시간 복잡도가 많이 커지지 않을까?

info 길이 + info길이 * log(info 길이) + Query * log(info 길이) * 24

= 5 * 10^4 * 4log5 + 10 ^ 5 * 4log5 * 24

= (5 * 10 ^4 + 10 ^ 6 * 2.4) * 3

시간 초과가 나지 않는다.

 

🤔 Query가 -처리 되어 있을 때, 해당 조건을 고려하지 않는 경우인데
      이 쿼리와 전체 조건을 어떻게 매칭시켜 줄 수 있을까?

-가 있는 경우 위의 키 24개를 다 확인해줘야 한다.

번거롭다.

나올 수 있는 키의 모든 경우를 다 구해주어 score를 저장해주자.

 

 

지원자들을 그룹별로 적절하게 미리 분류해두면 쿼리문마다 지원자들을 INFO 배열에서 찾지 않아도 된다.

 

4. 풀이

from collections import defaultdict

def solution(info, query):
    # 데이터 HashMap에 저장
    condition2scores = defaultdict(list)
    
    for one_info in info:
        language, field, career, food, score = one_info.split(" ")
        for first in (language, "-"):
            for second in (field, "-"):
                for third in (career, "-"):
                    for fourth in (food, "-"):
                        condition = first + " " + second + " " + third + " " + fourth
                        condition2scores[condition].append(int(score))
    
    for condition, scores in condition2scores.items():
        condition2scores[condition] = sorted(scores)
    
    # 각 쿼리마다 데이터의 개수 찾기
    answer = []
    
    for one_query in query:
        language, field, career, food_and_score = one_query.split(" and ")
        food, score = food_and_score.split(" ")
        
        condition = language + " " + field + " " + career + " " + food
        count = get_lower_bound(condition2scores[condition], int(score))
        answer.append(count)
    return answer

def get_lower_bound(scores, standard):
    N = len(scores)
    left, right, min_idx = 0, N - 1, N
    
    while left <= right: 
        mid = (left + right) // 2
        if scores[mid] >= standard:
            min_idx = min(min_idx, mid)
            right = mid - 1
        else:
            left = mid + 1
            
    return N - min_idx

 

5. 풀이 후 알게된 개념과 소감

  • Query에 대해서 찾아주려면, 나올 수 있는 모든 전체 Key를 일일이 Hash에 넣어서 확인해줘야 하는데, 이를 방지하기 위해서 Hash자체에 나올 수 있는 모든 Key와 그에 따른 Score 저장해두어 시간복잡도를 줄일 수 있었다.
  • 데이터를 그룹별로 적절하게 미리 분류해두어 매 조건마다 info 배열을 일일히 찾지 않게 않게 만듦으로써 시간복잡도를 줄이는 것이 이 문제의 포인트다.
  • python의 len함수와 java의 length 함수는 시간복잡도가 O(1)이 나온다.

'Problem Solving' 카테고리의 다른 글

[프로그래머스] 길 찾기 게임 (2019 KAKAO BLIND) / python  (0) 2022.08.17
[프로그래머스] 자물쇠와 열쇠 (2020 KAKAO BLIND) / python  (0) 2022.08.15
[프로그래머스] 광고 삽입 (2021 KAKAO BLIND) / python  (0) 2022.08.05
[프로그래머스] 불량사용자 (2019 KAKAO INTERNSHIP) / python  (0) 2022.07.28
[프로그래머스] 후보키 (2019 KAKAO BLIND) / python  (0) 2022.07.21
    'Problem Solving' 카테고리의 다른 글
    • [프로그래머스] 길 찾기 게임 (2019 KAKAO BLIND) / python
    • [프로그래머스] 자물쇠와 열쇠 (2020 KAKAO BLIND) / python
    • [프로그래머스] 광고 삽입 (2021 KAKAO BLIND) / python
    • [프로그래머스] 불량사용자 (2019 KAKAO INTERNSHIP) / python
    감사쟁이야
    감사쟁이야
    sunzero0116@gmail.com

    티스토리툴바