IT story

PyPi가 더 이상 다운로드 통계를 표시하지 않는 이유는 무엇입니까?

hot-time 2021. 1. 5. 19:17
반응형

PyPi가 더 이상 다운로드 통계를 표시하지 않는 이유는 무엇입니까?


패키지가 인기가 있는지 여부를 파악하는 것은 매우 편리했습니다 (그 인기가 다른 인기있는 패키지의 일부 "수입"케이스의 이유 인 경우에도). 하지만 지금은 어떤 이유로이 정보를 볼 수 없습니다.

예 : https://pypi.python.org/pypi/blist

왜이 유용한 기능을 껐습니까?


이 mail.python.org 기사 에서 볼 수 있듯이 다운로드 통계는 업데이트되지 않았고 수정하기가 너무 어렵 기 때문에 제거되었습니다.

이 기사의 저자 인 Donald Stufft는 다음과 같은 이유를 나열했습니다.

제거 / 지원 중단에 대한 여러 가지 이유는 다음과 같습니다.

  • 새로운 CDN으로 작업하기가 기술적으로 어렵습니다.
    • CDN이 PSF에 기부되고 있으며 기부 된 계층은 어떤 형태의 로그 액세스도 제공하지 않습니다.
    • 로그 액세스 권한이없는 해결 방법은 CDN의 유용성을 크게 줄입니다.
  • 매우 부정확 함
    • 다음과 같은 여러 요인으로 인해 다운로드 수가 부정확 해지는 것을 방지 할 수 있습니다.
      • pip 다운로드 캐시
      • 내부 또는 비공식 거울
      • PyPI에서 호스팅되지 않는 패키지 (비교를 위해)
      • 부풀려진 카운트를 일으키는 미러 또는 비공식 캡처 스크립트 (마지막으로 다운로드의 25 %가 알려진 미러링 스크립트에서 가져온 것임을 확인했습니다).
  • 특별히 유용하지 않음
    • 프로젝트를 많이 다운로드했다고해서 좋은 것은 아닙니다.
    • 마찬가지로 프로젝트가 많이 다운로드되지 않았다고해서 나쁘다는 의미는 아닙니다.

패키지 다운로드를보기 위해 방금 https://pepy.tech/릴리스했습니다 . BigQuery의 데이터를 사용 했으므로 동일한 결과를 얻을 수 있습니다. :-)


최근에이 링크를 통해 PSF 재단에 기여한 PyPI의 Big Query 데이터베이스를 쿼리 할 수 ​​있음을 알게되었습니다 .

또한 살펴보고 싶다면이 정보를 가져 오는 방법에 대한 블로그 게시물작성했습니다 .


pypinfo프로그램은 pip를 통해 설치할 수있는 BigQuery에 Python3 명령 줄 프로그램입니다. 자격 증명 (JSON 파일)을 설정하면 다음을 작성할 수 있어야합니다.

$ pypinfo -d 1825 blist year
Served from cache: False
Data processed: 250.31 GiB
Data billed: 250.31 GiB
Estimated cost: $1.23

| download_year | download_count |
| ------------- | -------------- |
|         2,017 |        443,067 |
|         2,016 |        391,816 |
|         2,018 |         57,689 |

데이터 수집에 대한 일부 정보는 https://packaging.python.org/guides/analyzing-pypi-package-downloads/ 에서 확인할 수 있습니다.

참조 URL : https://stackoverflow.com/questions/38102317/why-pypi-doesnt-show-download-stats-anymore

반응형