GitHub의 오픈 소스 프로젝트는 개발자가 기술 개발에 기여하면서 배우는 가장 좋은 방법일 것입니다. AI/ML 분야도 다르지 않습니다. 점점 더 많은 사람들이 AI/ML 모델을 구축하는 데 관심을 갖게 되었고, 몇몇 대형 기술 회사도 개발 발전을 위해 코드를 공개했습니다.

다음은 시도해볼 수 있는 이러한 인기 있는 오픈 소스 프로젝트 12개의 목록입니다!

TensorFlow

텐서플로 또는 텐서플로우는 다양한 작업에대해 데이터 흐름 프로그래밍을 위한 오픈소스 소프트웨어 라이브러리입니다. 심볼릭 수학 라이브러리이자, 인공 신경망같은 기계 학습 응용프로그램 및 딥러닝에도 사용된다. 위키백과

텐서플로(TensorFlow) 또는 텐서플로우는 다양한 작업에대해 데이터 흐름 프로그래밍을 위한 오픈소스 소프트웨어 라이브러리입니다. 심볼릭 수학 라이브러리이자, 인공 신경망같은 기계 학습 응용프로그램 및 딥러닝(deep Learning)에도 사용됩니다.

TensorFlow 플랫폼은 데이터 자동화, 모델 추적 및 재교육, 성능 모니터링에 사용됩니다. Google Brain 팀에서 개발했으며 약 150,000명의 활성 기여자가 있습니다. 이 모델의 유연성으로 인해 프로젝트에 포함하는 개발자 서클에서 매우 인기가 있습니다.

GitHub 리포지토리를 사용하면 사용자가 편의를 위해 클라우드 또는 모바일 장치에서 빌드할 수 있습니다. 이 알고리즘은 이미지 분류, 음성 인식, 분할 등과 같은 많은 컴퓨터 비전 기반 응용 프로그램에 사용됩니다.

OpenCV

OpenCV은 실시간 컴퓨터 비전을 목적으로 한 프로그래밍 라이브러리입니다. 원래는 인텔이 개발하였다. 실시간 이미지 프로세싱에 중점을 둔 라이브러리입니다. 인텔 CPU에서 사용되는 경우 속도의 향상을 볼 수 있는 IPP를 지원합니다. 위키백과

Computer Vision은 아마도 로봇에서 자율주행 차량에 이르기까지 인공 지능을 위한 가장 수요가 많은 도구일 것입니다. OpenCV는 기계 학습 작업에서 컴퓨터 비전을 사용하기 위한 대규모 오픈 소스 리포지토리를 제공하며 Python 개발자가 사용할 수 있습니다.

저장소에는 컴퓨터 비전과 관련된 2500개 이상의 알고리즘이 있으며 Google, IBM, Intel과 같은 빅 테크 회사는 많은 개발 프로젝트에서 이를 사용합니다.

React-Native

리액트 네이티브는 페이스북이 개발한 오픈 소스 모바일 애플리케이션 프레임워크입니다. 안드로이드, iOS, 웹, UWP용 애플리케이션을 개발하기 위해 사용되며, 개발자들이 네이티브 플랫폼 기능과 더불어 리액트를 사용할 수 있게 합니다. 완전하지 않은 Qt 포팅 또한 존재합니다. 위키백과

Facebook, Twitter 및 Pinterest를 포함한 거의 모든 소셜 미디어 플랫폼에서 사용됩니다. 프레임워크를 통해 개발자는 플n랫폼에서 기본 앱을 빌드하고, 기본 UI 컨트롤에 대한 전체 액세스 권한을 얻을 수 있습니다.

GitHub 커뮤니티에는 100,000개 이상의 별이 있으며 기여자가 활발하게 증가하고 있습니다. 플랫폼에는 개발자가 쉽게 이해하고 수정할 수 있는 선언적 보기가 있습니다.

DALL-E

DALL-E와 DALL-E 2는 오픈AI가 자연어 서술로부터 디지털 이미지를 생성하기 위해 개발한 기계 학습 모델입니다. DALL-E는 2021년 1월 블로그 게시물에서 오픈AI에 의해 공개되었으며, 이미지 생성을 위해 개조된 GPT-3 버전을 사용합니다.

text-to-image 모델이 화제가 되고 있으며 DALL-E가 GitHub에 코드를 공개함에 따라 가능성은 이제 무한합니다. 기계 학습 모델이 어떻게 작동하는지 알아보려면 DALL-E에 단어를 연결하고 기계가 "생각하는" 방식을 확인하세요.

GitHub의 오픈 소스 프로젝트는 VAE를 위해 DALL-E에서 사용되는 공식 PyTorch 패키지이지만 패키지에는 이미지 생성에 사용되는 변환기가 포함되어 있지 않습니다.

VAE는 Autoencoder로 데이터의 latent space를 찾으면서, 동시에 variational inference를 통해 latent space를 normal distribution을 가정한 prior로 regularization 합니다.

YOLOv7

YOLO는 You Only Look Once의 약자로써 이미지 및 동영상 탐지에 사용되는 딥러닝 모델입니다.

자율 차량, 로봇 또는 기타 비전 기반 장치와 관련하여 물체 감지는 시스템의 핵심 부분 중 하나입니다. 가장 빠르고 정확한 물체 감지 알고리즘 중 하나인 YOLOv7은 완벽한 솔루션을 제공합니다.

GitHub 리포지토리에는 개발자가 프로젝트에서 구현하고 이미지 컬렉션을 제공하여 모델을 교육할 수 있는 패키지가 포함되어 있으며 모델은 탐지 프로세스를 시작합니다.

쿠버네티스는 컨테이너화된 애플리케이션의 자동 디플로이, 스케일링 등을 제공하는 관리시스템으로, 오픈 소스 기반입니다. 원래 구글에 의해 설계되었고 현재 리눅스 재단에 의해 관리되고 있습니다. 위키백과

K8s는 개발자가 모든 플랫폼에서 컨테이너화된 앱을 관리할 수 있도록 Google에서 개발했습니다. 자동화된 시스템은 앱의 확장, 개발 및 관리를 지원합니다.

GitHub에 70,000개 이상의 별이 있는 Google에서 구축한 가장 인기 있는 저장소 중 하나입니다. 컨테이너 패키지 서비스의 글로벌 리더인 K8s는 CNCF(Cloud Native Computing Foundation)에서 호스팅합니다.

Flutter

플러터는 구글이 출시한 오픈 소스 크로스 플랫폼 GUI 애플리케이션 프레임워크입니다. 안드로이드, iOS, 윈도우즈, 리눅스 및 웹용 애플리케이션과 구글 퓨시아용 앱의 주된 소스코드로 사용된다. 위키백과

Google에서 개발한 또 다른 Flutter는 개발자가 인터페이스 툴킷을 사용하여 단일 코드베이스에서 앱을 빌드할 수 있게 해주는 소프트웨어 개발 키트(SDK)입니다. Skia에 의해 구동되므로 생성된 앱은 PC, 웹 및 모바일 플랫폼과 호환됩니다.

GitHub의 100,000 별 커뮤니티는 witbiOS와 함께 Android 및 Chromium 기반 애플리케이션과 호환되며 코드를 엉망으로 만들지 않고 그래픽, 텍스트 및 비디오 오버레이를 매끄럽게 통합하는 데 효과적입니다.

Jenkins

젠킨스는 소프트웨어 개발 시 지속적 통합 서비스를 제공하는 툴입니다. 다수의 개발자들이 하나의 프로그램을 개발할 때 버전 충돌을 방지하기 위해 각자 작업한 내용을 공유 영역에 있는 Git등의 저장소에 빈번히 업로드함으로써 지속적 통합이 가능하도록 해 준다. MIT 라이선스를 따른다. 위키백과

이 Java 기반 자동화 서버에는 거의 모든 것을 자동화하기 위한 1800개 이상의 플러그인이 있습니다. 사용하기 쉬운 프레임워크이며 모든 언어로 조정 가능한 지속적인 통합 및 전달 환경을 제공하는 것과 함께 애플리케이션을 빌드, 테스트 및 배포하는 데 유용합니다.

Jenkins는 정적 코드 분석 및 모델의 버그 감지에도 유용합니다. 이 서버를 통해 개발자는 지루하고 반복적인 작업을 실행 및 자동화하고 기계가 할 수 없는 작업에 집중할 수 있습니다.

Ansible

Ansible은 오픈 소스 소프트웨어 프로비저닝, 구성 관리, 애플리케이션 전개 도구입니다. 수많은 유닉스 계열 시스템에서 실행되며 유닉스 계열 운영 체제 및 마이크로소프트 윈도우의 구성이 가능하다. 시스템 구성을 기술하기 위해 자체 선언형 언어를 포함하고 있습니다. 위키백과

2016년 RedHat에서 시작한 Ansible은 개발자가 시스템을 구성하고, 네트워크를 관리하고, 소프트웨어를 배포할 수 있는 자동화 플랫폼입니다. 설정이 매우 간단하고 학습 곡선이 거의 없기 때문에 많은 관심과 기여를 받았습니다.

약 55,000개의 별이 있는 Ansible은 접근 방식이 일반 영어와 매우 유사하기 때문에 적극적으로 기여 및 업데이트를 받고 있습니다.

PredictionIO

Apache PredictionIO®는 개발자와 데이터 과학자가 모든 기계 학습 작업에 대한 예측 엔진을 생성할 수 있도록 최첨단 오픈 소스 스택 위에 구축된 오픈 소스 기계 학습 서버 입니다. 다음을 수행할 수 있습니다.

  • 사용자 지정 가능한 템플릿 을 사용하여 프로덕션 환경에서 엔진을 웹 서비스로 신속하게 구축 및 배포합니다 .
  • 웹 서비스로 배포되면 실시간 으로 동적 쿼리에 응답합니다 .
  • 여러 엔진 변형을 체계적으로 평가하고 조정합니다.
  • 포괄적인 예측 분석을 위해 여러 플랫폼의 데이터를 일괄 또는 실시간으로 통합합니다.
  • 체계적인 프로세스와 사전 구축된 평가 수단으로 머신 러닝 모델링 속도를 높입니다.
  • Spark MLLib 및 OpenNLP와 같은 기계 학습 및 데이터 처리 라이브러리 지원
  • 고유한 기계 학습 모델을 구현하고 이를 엔진에 원활하게 통합합니다.
  • 데이터 인프라 관리를 단순화합니다.

알고리즘 배포, 이벤트 수집 및 평가, 예측 결과 쿼리를 지원하는 오픈 소스 ML 프레임워크입니다. HBase, Hadoop, Spark 및 Elasticsearch를 기반으로 하며 기계 학습 프로젝트를 위한 예측 엔진을 생성합니다.

이 프로젝트는 GitHub에 12,000개 이상의 별을 가지고 있으며 REST API를 통해 예측 결과를 생성합니다.

LightGBM

영어에서 번역됨-LightGBM은 Light Gradient-Boosting Machine의 약자로, 원래 Microsoft에서 개발한 머신 러닝을 위한 무료 오픈 소스 분산 그래디언트 부스팅 프레임워크입니다. 위키백과(영어)

의사 결정 트리 알고리즘을 기반으로 하는 가장 빠른 고성능 그래디언트 부스팅 프레임워크인 LightGBM은 주로 다른 기계 학습 작업 중에서 분류, 순위 지정에 사용됩니다. 여러 GPU로 대규모 데이터 및 병렬 학습을 지원하므로 다른 모든 경쟁자보다 매력적입니다.

Microsoft에서 개발한 LightGBM은 GitHub에 약 14,000개의 별을 가지고 있으며 개발자로부터 적극적으로 기여를 받고 있습니다.

ElasticSearch

일래스틱서치는 루씬 기반의 검색 엔진입니다. HTTP 웹 인터페이스와 스키마에서 자유로운 JSON 문서와 함께 분산 멀티테넌트 지원 전문 검색 엔진을 제공한다. 일래스틱서치는 자바로 개발되어 있으며 아파치 라이선스 조항에 의거하여 오픈 소스로 출시되어 있습니다. 위키백과

이 오픈 소스 프로젝트는 대용량 데이터를 실시간으로 분석, 검색 및 저장합니다. 이는 로그, 메트릭, 엔드포인트 보안, 검색 백엔드 및 애플리케이션 모니터링과 같은 데이터 관리가 필요한 프로젝트에 통합될 수 있습니다.

60,000개 이상의 별을 보유한 Elasticsearch는 개발자가 프로젝트 내에서 다양한 검색 엔진의 백엔드를 구축하고 개선할 수 있도록 해왔습니다.

반응형

Build Your Own x

이 환상적인 저장소는 기본적으로 자신의 기술을 구축하는 방법에 대한 자습서 모음입니다. 명령 행 도구, 운영 체제, 검색 엔진, 3D 렌더러 등을 빌드하는 방법에 대한 예가 있습니다.

자신 만의 프로그래밍 언어를 만들고 싶었던 적이 있습니까? 아니면 자신 만의 Docker 또는 Git? 그런 다음 이것이 당신에게 맞는 저장소입니다.

무료 프로그래밍 책

이 저장소의 이름은 Free Programming Books이지만 그 이상을 제공합니다. 다양한 언어로 제공되며 무료 온라인 강좌, 대화식 프로그래밍 리소스, 문제 세트 및 경쟁 프로그래밍, 팟 캐스트 및 프로그래밍 실행해 볼 수 있는 섹션이 포함되어 있습니다.

Oh My Zsh(*)

Oh My Zsh 는 Zsh 구성 관리를 위한 커뮤니티 중심의 공개 소스 프레임 워크입니다. Zsh는 대화형 shell이자 많은 개발자가 사용하는 강력한 스크립트 언어입니다.

Oh My Zsh에는 Zsh 설정을 사용자 정의 할 수있는 강력한 플러그인과 멋진 테마가 있습니다. 시작하고 실행하는 것은 약간의 작업이지만. 웹에는 훌륭한 자습서와 다른 개발자의 예제가 있으며 올바른 설정을 찾는 데 도움이됩니다.

나중에 이것저것 해보다가 zsh 로 귀결하게 되어있습니다.

코딩인터뷰 대학

코딩인터뷰 대학는 취업을 하고자하는 분들에게 필요한 인터뷰 질문들을 모아놓은 사이트 입니다.

Amazon, Google 또는 Facebook과 같은 대기업의 소프트웨어 엔지니어가 될 여러 달 연구 계획. 이는 CS 지식이 필요한 소프트웨어 공학을 처음 접하는 사람들을 위한 것이며 신뢰성 엔지니어 또는 운영 엔지니어가 되기 위해 공부하는 방법에 대한 조언을 제공합니다.

저자는 원래 이 Repo를 자신의 학습 과정을 추적하기 위해 개인 할 일 목록으로 만들었습니다. 몇 달 동안 하루에 8시간에서 12 시간을 공부 한 후 마침내 아마존에서 소프트웨어 개발 엔지니어로 꿈의 직업을 갖게되었습니다.

Coding Interview University는 Google, Microsoft, Facebook 등의 회사에서 기술 인터뷰를 준비하는 데 도움을줍니다. 그것을 최대한 활용하십시오.

Gitignore 모음집

이 저장소는 이름에서 알 수 있듯이 유용한 .gitignore 템플릿 모음입니다.

GitHub 리포지토리로 설정 한 모든 새 프로젝트에 대해 업로드되는 항목을 필터링하기 위해 .gitignore 파일이 있어야합니다. 이 파일의 내용은 프로젝트마다, 언어마다 다릅니다.
저장소에는 Rails, Python, Perl, Laravel, Java 등과 같은 거의 모든 언어 또는 프레임 워크를위한 템플릿이 포함되어 있습니다.

시스템 설계 입문서

개인적으로 도움이 많이 되었던 Repo 입니다.

이것은 대규모 시스템을 설계하는 방법을 배우는 데 도움이 됩니다. 소프트웨어 엔지니어를 위한 훌륭한 저장소입니다. 그러면 더 나은 엔지니어가 될 수 있습니다. Repo는 이 광범위한 주제에 대한 체계적인 리소스 모음을 제공합니다.

시스템 설계는 많은 회사에서 기술 인터뷰 프로세스의 필수 구성 요소 인 경우가 많으므로 이 리포지토리를 통해 학습 가이드와의 인터뷰, 인터뷰 방법에 대한 조언, 솔루션과의 인터뷰 질문, Anki 플래시 카드 세트를 준비 할 수 있습니다. 대화식 학습 및 대화식 코딩 문제.

Public APIs

Public API는 프로젝트 및 애플리케이션에 사용할 수있는 무료 API 목록입니다. 비즈니스, 애니메이션, 동물, 뉴스, 금융, 게임 등과 같은 다양한 주제를 다룹니다.

고양이 또는 개와 같은 API가 있습니다. 고양이 또는 개 그림을 제공합니다.

그러나 Gmail API 또는 Google Analytics API와 같은 더 유용한 것들도 있습니다.

커맨드 라인의 기술

개발자는 명령 행 작업 방법을 아는 것이 종종 무시되지만 엔지니어로서의 생산성과 유연성을 향상시키는 데 도움이됩니다. 이 저장소에는 Linux에서 작업 할 때 명령 행 사용에 대한 유용한 정보와 팁이 있습니다. Windows 또는 macOS 전용 섹션이 있으며 일반적으로 다른 UNIX 기반 OS에도 적용 할 수 있습니다. 초보자와 경험이 많은 사람 모두에게 적합합니다.

리포지토리는 더 이상 활성 상태로 유지되지 않는 것 같지만 여전히 명령 줄 작업에 도움이되는 유용한 팁을 제공합니다. 그리고 당신은 항상 저장소를 포크하고 직접 유지할 수 있습니다.

Javascript 알고리즘 및 데이터 구조

이 저장소에는 JavaScript에 대한 많은 인기있는 알고리즘 및 데이터 구조의 예가 들어 있습니다. 각 예는 초보자 또는 고급으로 표시되어 어려움을 나타냅니다. hash table, heap, queue, stack, math, strings(문자열), sets(집합) 등에 대한 예가 있습니다.

개발자 로드맵

개발을 어느정도 다룰 수 있게 되었을 때, 자신이 하고싶은 언어를 살펴보기 위해서 자주 봤었습니다. 분기별로 한번씩 읽어주면, 현재 개발 생태계를 파악하는데 도움이 많이 됩니다.

마지막 저장소에는 2020 년에 프론트 엔드, 백엔드 또는 데브 옵스 엔지니어가되기 위해 채택해야 할 다양한 경로와 기술을 보여주는 일련의 차트가 포함되어 있습니다. 처음에는 다소 압도적이지만 빠르게 변화하는이 산업에서 가능하고 필요한 것에 대한 유용한 가이드.

리포지토리는 매년 생태계의 변화를 반영하여 업데이트됩니다.

반응형

뭐 새로운 배울꺼 없나 싶어 찾아 보다가. github.com 을 통해서 page 를 만들 수 있다는 사실을 알게 되었다. 그래서 한번 그냥 만들어 보자 싶어 만들어 본다.

시작

tistory 블로그를 적을 때에도 markdown 을 사용해서 HTML 로 컨버팅을 해서 문서 작업을 하고 있었는데, Jekyll을 사용하면 반복적인 작업을 할 필요가 없다.

의문점

  1. 구글에서 검색이 잘될까?

장점

  • 호스팅 서비스가 필요없다.
  • 설치가 쉽다.(그런데 이상하게 안됨)
  • markdown 언어로 간편하게 적을 수 있다.
  • 어디서든지 git 을 사용할 줄 알면 글을 적을 수 있다.

단점

여기서에서 github page 에대한 제한 사항이 있습니다.

  • 페이지늬 소스는 1GB 아래여야 합니다.
  • Github Pages sites 는 매달 100GB 전송량 제한이 있습니다.
  • Github Pages sites 대 시간 빌드를 10번으로 제한 합니다.
  • github 을 사용할 줄 알아야 한다.
  • markdown 문법을 배워야 한다.
  • 설치가 반영되기까지가 좀 시간이 걸린다. 테마 설치를 하려고 하는데, 늦게 반영이 되더라
    theme 을 적용하고 난 뒤에 메인 페이지가 나오지 않아서 왜 이러지하고 찾아봤는데, 시간이 좀 지나고 난 뒤에 접속을 하니 되더라.

설치하기

구글링하면 많이 나온다 에서 많은 사람들에 이에 관한 문서들을 남겨놓았다. 굳히, 나까지 이런 문서를 남겨놓을 필요는 없을 것 같다.

반응형

+ Recent posts