Viblo AI

@ai

Báo cáo

Bài viết được ghim

Viblo AI

thg 12 28, 2023 8:00 SA 14 phút đọc

Paper reading | EfficientNetV2: Smaller Models and Faster Training

Đóng góp của bài báo

Kết quả training có độ chính xác cao là rất tốt tuy nhiên việc tối ưu thời gian, tài nguyên training và inference của model cũng quan trọng không kém Được giới thiệu lần đầu vào năm 2020, EfficientNet là một họ các mô hình hiệu suất cao được tối ưu hóa cho việc huấn luyện hiệu quả trên các tác vụ liên quan đến hình ảnh. Với việc kết hợp phương pháp scaling và compound s...

Deep Learning

218

Viblo AI

Paper reading | Video Swin Transformer

Deep Learning Transformer

146

Viblo AI

Paper Reading | DIT: SELF-SUPERVISED PRE-TRAINING FOR DOCUMENT IMAGE TRANSFORMER

Deep Learning Machine Learning sharpComputerVision

141

Viblo AI

Paper Reading | ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision

Machine Learning Transformer

257

Viblo AI

Paper reading | MOBILEVIT: LIGHT-WEIGHT, GENERAL-PURPOSE, AND MOBILE-FRIENDLY VISION TRANSFORMER

Deep Learning Machine Learning

131

Viblo AI

Paper Reading | ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders

Mayfest2023 Deep Learning

519

Tất cả bài viết

141

Viblo AI thg 7 20, 2023 3:18 CH

17 phút đọc

Paper Reading | DIT: SELF-SUPERVISED PRE-TRAINING FOR DOCUMENT IMAGE TRANSFORMER

Giới thiệu chung

Các bài toán trích xuất thông tin từ hình ảnh luôn được nhận sự quan tâm vì tính ứng dụng rộng rãi. Đặc biệt trong các bài toán liên quan đến trích xuất thông tin từ ảnh tài liệu. Trong vài năm trở lại đây, Transformer trở thành một game changer, không chỉ đạt những kết quả ấn tượng trong các tác vụ về Natural language processing mà những tác vụ Computer Vision cũng đạt những ...

Deep Learning Machine Learning sharpComputerVision

257

Viblo AI thg 6 29, 2023 6:19 SA

11 phút đọc

Paper Reading | ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision

Giới thiệu chung

Các mô hình Vision-and-Language pretraining (VLP) tỏ ra hiệu quả trong việc cải thiện các downstream task liên quan đến sự kết hợp thông tin cả ngôn ngữ và hình ảnh. Để đưa vào mô hình VLP, các pixel ảnh cần được embed cùng với các language token. Với bước embed ảnh thì không còn xa lạ rồi, ta có thể sử dụng những mạng CNN phổ biến

Cho đến nay, hầu hết các nghiên cứu VLP đ...

Machine Learning Transformer

131

Viblo AI thg 6 7, 2023 8:41 SA

11 phút đọc

Paper reading | MOBILEVIT: LIGHT-WEIGHT, GENERAL-PURPOSE, AND MOBILE-FRIENDLY VISION TRANSFORMER

Giới thiệu chung Các mô hình CNN đạt được kết quả SOTA trong các task về mobile vision. Spatial inductive bias cho phép những mô hình này học với ít tham số hơn với các task Computer Vision khác nhau. Tuy nhiên, những mạng CNN có tính cục bộ về mặt không gian. Để có thể học được global representations, self-attention based vision transformer được sử dụng. Tuy đạt được kết quả chính xác cao, như...

Deep Learning Machine Learning

135

Viblo AI thg 5 17, 2023 7:22 SA

9 phút đọc

Paper reading | Neural News Recommendation with Attentive Multi-View Learning

1. Động lực

Việc cá nhân hóa trong gợi ý tin bài là rất quan trọng với các nền tảng đọc báo online hiện tại, điều này làm tăng trải nghiệm người dùng lên đáng kể. Các phương pháp gợi ý hiện tại chỉ dựa vào biểu diễn thông tin đơn lẻ của tin bài (ví dụ: title, body,...) và như thế là chưa đủ. Do vậy, cần một cách tiếp cận khác để tăng độ chính xác trong việc gợi ý tin bài cho người dùng.

2. ...

Mayfest2023 Deep Learning Recommendation System

519

Viblo AI thg 5 12, 2023 5:55 SA

11 phút đọc

Paper Reading | ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders

1. Động lực

Các bài toán Computer Vision ngày càng đạt hiệu suất cao nhờ sự phát triển về kiến trúc mô hình và các framework hiện đại. Tuy được thiết kế theo hướng supervised learning trên tập ImageNet đã được gán nhãn nhưng các model này vẫn có tiềm năng cải thiện hơn nữa theo cách tiếp cận self-supervised learning ví dụ như Masked autoencoders (MAE). Tuy nhiên, nhóm tác giả nhận thấy là kết...

Mayfest2023 Deep Learning

Tổng số lượt xem bài viết

7.4K

Reputations

991

Các thẻ theo dõi

Đang theo dõi các người dùng

Các người dùng đang theo dõi

Bài viết

Bookmark

Tổng số câu hỏi

Tổng số câu trả lời

Xem tất cả >