GitHub의 오픈 소스 프로젝트는 개발자가 기술 개발에 기여하면서 배우는 가장 좋은 방법일 것입니다. AI/ML 분야도 다르지 않습니다. 점점 더 많은 사람들이 AI/ML 모델을 구축하는 데 관심을 갖게 되었고, 몇몇 대형 기술 회사도 개발 발전을 위해 코드를 공개했습니다.

다음은 시도해볼 수 있는 이러한 인기 있는 오픈 소스 프로젝트 12개의 목록입니다!

TensorFlow

텐서플로 또는 텐서플로우는 다양한 작업에대해 데이터 흐름 프로그래밍을 위한 오픈소스 소프트웨어 라이브러리입니다. 심볼릭 수학 라이브러리이자, 인공 신경망같은 기계 학습 응용프로그램 및 딥러닝에도 사용된다. 위키백과

텐서플로(TensorFlow) 또는 텐서플로우는 다양한 작업에대해 데이터 흐름 프로그래밍을 위한 오픈소스 소프트웨어 라이브러리입니다. 심볼릭 수학 라이브러리이자, 인공 신경망같은 기계 학습 응용프로그램 및 딥러닝(deep Learning)에도 사용됩니다.

TensorFlow 플랫폼은 데이터 자동화, 모델 추적 및 재교육, 성능 모니터링에 사용됩니다. Google Brain 팀에서 개발했으며 약 150,000명의 활성 기여자가 있습니다. 이 모델의 유연성으로 인해 프로젝트에 포함하는 개발자 서클에서 매우 인기가 있습니다.

GitHub 리포지토리를 사용하면 사용자가 편의를 위해 클라우드 또는 모바일 장치에서 빌드할 수 있습니다. 이 알고리즘은 이미지 분류, 음성 인식, 분할 등과 같은 많은 컴퓨터 비전 기반 응용 프로그램에 사용됩니다.

OpenCV

OpenCV은 실시간 컴퓨터 비전을 목적으로 한 프로그래밍 라이브러리입니다. 원래는 인텔이 개발하였다. 실시간 이미지 프로세싱에 중점을 둔 라이브러리입니다. 인텔 CPU에서 사용되는 경우 속도의 향상을 볼 수 있는 IPP를 지원합니다. 위키백과

Computer Vision은 아마도 로봇에서 자율주행 차량에 이르기까지 인공 지능을 위한 가장 수요가 많은 도구일 것입니다. OpenCV는 기계 학습 작업에서 컴퓨터 비전을 사용하기 위한 대규모 오픈 소스 리포지토리를 제공하며 Python 개발자가 사용할 수 있습니다.

저장소에는 컴퓨터 비전과 관련된 2500개 이상의 알고리즘이 있으며 Google, IBM, Intel과 같은 빅 테크 회사는 많은 개발 프로젝트에서 이를 사용합니다.

React-Native

리액트 네이티브는 페이스북이 개발한 오픈 소스 모바일 애플리케이션 프레임워크입니다. 안드로이드, iOS, 웹, UWP용 애플리케이션을 개발하기 위해 사용되며, 개발자들이 네이티브 플랫폼 기능과 더불어 리액트를 사용할 수 있게 합니다. 완전하지 않은 Qt 포팅 또한 존재합니다. 위키백과

Facebook, Twitter 및 Pinterest를 포함한 거의 모든 소셜 미디어 플랫폼에서 사용됩니다. 프레임워크를 통해 개발자는 플n랫폼에서 기본 앱을 빌드하고, 기본 UI 컨트롤에 대한 전체 액세스 권한을 얻을 수 있습니다.

GitHub 커뮤니티에는 100,000개 이상의 별이 있으며 기여자가 활발하게 증가하고 있습니다. 플랫폼에는 개발자가 쉽게 이해하고 수정할 수 있는 선언적 보기가 있습니다.

DALL-E

DALL-E와 DALL-E 2는 오픈AI가 자연어 서술로부터 디지털 이미지를 생성하기 위해 개발한 기계 학습 모델입니다. DALL-E는 2021년 1월 블로그 게시물에서 오픈AI에 의해 공개되었으며, 이미지 생성을 위해 개조된 GPT-3 버전을 사용합니다.

text-to-image 모델이 화제가 되고 있으며 DALL-E가 GitHub에 코드를 공개함에 따라 가능성은 이제 무한합니다. 기계 학습 모델이 어떻게 작동하는지 알아보려면 DALL-E에 단어를 연결하고 기계가 "생각하는" 방식을 확인하세요.

GitHub의 오픈 소스 프로젝트는 VAE를 위해 DALL-E에서 사용되는 공식 PyTorch 패키지이지만 패키지에는 이미지 생성에 사용되는 변환기가 포함되어 있지 않습니다.

VAE는 Autoencoder로 데이터의 latent space를 찾으면서, 동시에 variational inference를 통해 latent space를 normal distribution을 가정한 prior로 regularization 합니다.

YOLOv7

YOLO는 You Only Look Once의 약자로써 이미지 및 동영상 탐지에 사용되는 딥러닝 모델입니다.

자율 차량, 로봇 또는 기타 비전 기반 장치와 관련하여 물체 감지는 시스템의 핵심 부분 중 하나입니다. 가장 빠르고 정확한 물체 감지 알고리즘 중 하나인 YOLOv7은 완벽한 솔루션을 제공합니다.

GitHub 리포지토리에는 개발자가 프로젝트에서 구현하고 이미지 컬렉션을 제공하여 모델을 교육할 수 있는 패키지가 포함되어 있으며 모델은 탐지 프로세스를 시작합니다.

쿠버네티스는 컨테이너화된 애플리케이션의 자동 디플로이, 스케일링 등을 제공하는 관리시스템으로, 오픈 소스 기반입니다. 원래 구글에 의해 설계되었고 현재 리눅스 재단에 의해 관리되고 있습니다. 위키백과

K8s는 개발자가 모든 플랫폼에서 컨테이너화된 앱을 관리할 수 있도록 Google에서 개발했습니다. 자동화된 시스템은 앱의 확장, 개발 및 관리를 지원합니다.

GitHub에 70,000개 이상의 별이 있는 Google에서 구축한 가장 인기 있는 저장소 중 하나입니다. 컨테이너 패키지 서비스의 글로벌 리더인 K8s는 CNCF(Cloud Native Computing Foundation)에서 호스팅합니다.

Flutter

플러터는 구글이 출시한 오픈 소스 크로스 플랫폼 GUI 애플리케이션 프레임워크입니다. 안드로이드, iOS, 윈도우즈, 리눅스 및 웹용 애플리케이션과 구글 퓨시아용 앱의 주된 소스코드로 사용된다. 위키백과

Google에서 개발한 또 다른 Flutter는 개발자가 인터페이스 툴킷을 사용하여 단일 코드베이스에서 앱을 빌드할 수 있게 해주는 소프트웨어 개발 키트(SDK)입니다. Skia에 의해 구동되므로 생성된 앱은 PC, 웹 및 모바일 플랫폼과 호환됩니다.

GitHub의 100,000 별 커뮤니티는 witbiOS와 함께 Android 및 Chromium 기반 애플리케이션과 호환되며 코드를 엉망으로 만들지 않고 그래픽, 텍스트 및 비디오 오버레이를 매끄럽게 통합하는 데 효과적입니다.

Jenkins

젠킨스는 소프트웨어 개발 시 지속적 통합 서비스를 제공하는 툴입니다. 다수의 개발자들이 하나의 프로그램을 개발할 때 버전 충돌을 방지하기 위해 각자 작업한 내용을 공유 영역에 있는 Git등의 저장소에 빈번히 업로드함으로써 지속적 통합이 가능하도록 해 준다. MIT 라이선스를 따른다. 위키백과

이 Java 기반 자동화 서버에는 거의 모든 것을 자동화하기 위한 1800개 이상의 플러그인이 있습니다. 사용하기 쉬운 프레임워크이며 모든 언어로 조정 가능한 지속적인 통합 및 전달 환경을 제공하는 것과 함께 애플리케이션을 빌드, 테스트 및 배포하는 데 유용합니다.

Jenkins는 정적 코드 분석 및 모델의 버그 감지에도 유용합니다. 이 서버를 통해 개발자는 지루하고 반복적인 작업을 실행 및 자동화하고 기계가 할 수 없는 작업에 집중할 수 있습니다.

Ansible

Ansible은 오픈 소스 소프트웨어 프로비저닝, 구성 관리, 애플리케이션 전개 도구입니다. 수많은 유닉스 계열 시스템에서 실행되며 유닉스 계열 운영 체제 및 마이크로소프트 윈도우의 구성이 가능하다. 시스템 구성을 기술하기 위해 자체 선언형 언어를 포함하고 있습니다. 위키백과

2016년 RedHat에서 시작한 Ansible은 개발자가 시스템을 구성하고, 네트워크를 관리하고, 소프트웨어를 배포할 수 있는 자동화 플랫폼입니다. 설정이 매우 간단하고 학습 곡선이 거의 없기 때문에 많은 관심과 기여를 받았습니다.

약 55,000개의 별이 있는 Ansible은 접근 방식이 일반 영어와 매우 유사하기 때문에 적극적으로 기여 및 업데이트를 받고 있습니다.

PredictionIO

Apache PredictionIO®는 개발자와 데이터 과학자가 모든 기계 학습 작업에 대한 예측 엔진을 생성할 수 있도록 최첨단 오픈 소스 스택 위에 구축된 오픈 소스 기계 학습 서버 입니다. 다음을 수행할 수 있습니다.

  • 사용자 지정 가능한 템플릿 을 사용하여 프로덕션 환경에서 엔진을 웹 서비스로 신속하게 구축 및 배포합니다 .
  • 웹 서비스로 배포되면 실시간 으로 동적 쿼리에 응답합니다 .
  • 여러 엔진 변형을 체계적으로 평가하고 조정합니다.
  • 포괄적인 예측 분석을 위해 여러 플랫폼의 데이터를 일괄 또는 실시간으로 통합합니다.
  • 체계적인 프로세스와 사전 구축된 평가 수단으로 머신 러닝 모델링 속도를 높입니다.
  • Spark MLLib 및 OpenNLP와 같은 기계 학습 및 데이터 처리 라이브러리 지원
  • 고유한 기계 학습 모델을 구현하고 이를 엔진에 원활하게 통합합니다.
  • 데이터 인프라 관리를 단순화합니다.

알고리즘 배포, 이벤트 수집 및 평가, 예측 결과 쿼리를 지원하는 오픈 소스 ML 프레임워크입니다. HBase, Hadoop, Spark 및 Elasticsearch를 기반으로 하며 기계 학습 프로젝트를 위한 예측 엔진을 생성합니다.

이 프로젝트는 GitHub에 12,000개 이상의 별을 가지고 있으며 REST API를 통해 예측 결과를 생성합니다.

LightGBM

영어에서 번역됨-LightGBM은 Light Gradient-Boosting Machine의 약자로, 원래 Microsoft에서 개발한 머신 러닝을 위한 무료 오픈 소스 분산 그래디언트 부스팅 프레임워크입니다. 위키백과(영어)

의사 결정 트리 알고리즘을 기반으로 하는 가장 빠른 고성능 그래디언트 부스팅 프레임워크인 LightGBM은 주로 다른 기계 학습 작업 중에서 분류, 순위 지정에 사용됩니다. 여러 GPU로 대규모 데이터 및 병렬 학습을 지원하므로 다른 모든 경쟁자보다 매력적입니다.

Microsoft에서 개발한 LightGBM은 GitHub에 약 14,000개의 별을 가지고 있으며 개발자로부터 적극적으로 기여를 받고 있습니다.

ElasticSearch

일래스틱서치는 루씬 기반의 검색 엔진입니다. HTTP 웹 인터페이스와 스키마에서 자유로운 JSON 문서와 함께 분산 멀티테넌트 지원 전문 검색 엔진을 제공한다. 일래스틱서치는 자바로 개발되어 있으며 아파치 라이선스 조항에 의거하여 오픈 소스로 출시되어 있습니다. 위키백과

이 오픈 소스 프로젝트는 대용량 데이터를 실시간으로 분석, 검색 및 저장합니다. 이는 로그, 메트릭, 엔드포인트 보안, 검색 백엔드 및 애플리케이션 모니터링과 같은 데이터 관리가 필요한 프로젝트에 통합될 수 있습니다.

60,000개 이상의 별을 보유한 Elasticsearch는 개발자가 프로젝트 내에서 다양한 검색 엔진의 백엔드를 구축하고 개선할 수 있도록 해왔습니다.

반응형

+ Recent posts