
Компания Apple поделилась подробностями своего участия в конференции IEEE/CVF по компьютерному зрению и распознаванию образов (CVPR) в этом году. Вот основные детали.
Исследователи Apple представят свои работы на CVPR
Сегодня Apple объявила расписание и детали своего участия в конференции CVPR этого года, спонсором которой также выступает компания.
В этом году CVPR пройдет с 3 по 7 июня в конференц-центре Колорадо в Денвере. Apple примет участие в мероприятии посредством стендовых и устных докладов, приглашенных выступлений, основного доклада (keynote) и тематических мероприятий.
Ниже представлены исследования, которые Apple презентует на CVPR в этом году; некоторые из них ранее освещались на 9to5Mac:
- AMUSE: Аудиовизуальный эталон и платформа согласования для агентного понимания многоканальной речи
- AToken: Унифицированный токенизатор для компьютерного зрения
- Автоматизация аннотирования жестового языка с помощью специализированных языковых моделей
- DSO: Прямая оптимизация управления для минимизации предвзятости
- От местоположения объектов к их назначению: Бенчмаркинг пространственно-функционального интеллекта для мультимодальных больших языковых моделей (LLM)
- Изучение долгосрочных эмбеддингов движения для эффективной генерации кинематики
- Pico-Banana-400K: Крупномасштабный набор данных для редактирования изображений с текстовым описанием
- SO-Bench: Оценка структурного вывода мультимодальных LLM
- STARFlow-V: Сквозное генеративное моделирование видео с использованием нормализующих потоков
- TrajTok: Изучение токенов траектории для улучшения понимания видео
- UniGen-1.5: Улучшение генерации и редактирования изображений за счет объединения вознаграждений в обучении с подкреплением
- Velox: Изучение представлений 4D-геометрии и внешнего вида
- VSAS-Bench: Оценка в реальном времени моделей визуальных потоковых ассистентов
- Что важно в практическом обучении сжатию изображений
Исследователь Apple Колин Ли также выступит с основным докладом на семинаре по генеративному ИИ для жестового языка (GenSign), после чего в период с 3 по 4 июня последуют три других приглашенных выступления с участием инженеров Apple.
Компания также подтвердила, что исследователи Син-Пин (Синди) Хуанг и Мэгги Сяо будут представлять Apple на ужине по наставничеству Women in Computer Vision (WiCV).
Чтобы ознакомиться с полным расписанием участия Apple в CVPR в этом году, перейдите по этой ссылке.