Nvimgcodec + tensor ipc #38

soodoshll · 2026-02-05T22:00:07Z

New Requirements:

nvidia-nvjpeg
nvidia-nvimgcodec-cu13==0.7.0.11

nvimgcodec is enabled by default. Note that this change does not affect the image loader in dynamo.vllm, which has its own image processs logic. Will come up with a PR to dynamo later.

Enable tensor ipc with
--multimodal-tensor-ipc=torch_shm

**Note: ** images sent to the api server will be decoded even before being added to the waiting queue, so please throttle the max concurrency at the client side (now I use 384 * num_backend), which potentially requires modifying task.py.

cc @wangshangsam

Make tensor IPC datapath optional/config-based Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Missed as part of rebase. This suggestion makes sense Co-authored-by: gemini-code-assist[bot] <176961590+gemini-code-assist[bot]@users.noreply.github.com> Signed-off-by: Brandon Pelfrey <brandonpelfrey@gmail.com> Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

soodoshll · 2026-02-05T22:00:37Z

~~Oops, need to pick out some irrelevant commits.~~
Done

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

…atype, cleanup on scheduler finished_req_ids Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

This reverts commit bf71fe5.

soodoshll and others added 21 commits February 3, 2026 13:30

upd

5468273

upd

60557b2

Add tensor IPC transfer mechanism for multimodal data

54968a8

Make tensor IPC datapath optional/config-based Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Default to not use Tensor IPC datapath

84c8d65

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Enable/Disable Tensor IPC datapath via args with explicit dest

cb0893f

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Normalize DP config in engine/core

ba500df

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Handling TensorIpcHandle for dec_hook

12fbbf4

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

formatting, type fixes, additional issues from CI review bots

c8c3daf

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Handle orphaned tensors during timeout

a16a093

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

remove references to maximum_concurrent_videos

2ab0074

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Handle race condition between tensor cleanup and decode threads

1107bcc

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Ensure tensor queue is non-null

d11a8a6

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

SyncMPClient: set target engine for IPC routing

2fecb85

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Remove video-related options leftover from other PR

4fbc3c0

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

remove --disable-multimodal-tensor-ipc

1df4745

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

multimodal_tensor_ipc = False

c3b7856

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

rename _decode_ipc_queue_tensor

500dc8c

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Use encoder_request_context across MP/Async Clients

809fe38

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Symmetric _encode/_decode methods for tensor queues

0140d4f

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Handle _decode_tensor calls for both TensorIpcHandle/dict cases

68e5bc6

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

soodoshll mentioned this pull request Feb 5, 2026

feat: nvimgcodec + threadpool for image processor CentML/dynamo#10

Merged

brandonpelfrey added 7 commits February 5, 2026 17:07

remove VLLM_MULTIMODAL_TENSOR_IPC env variable

8bf94c4

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

CR comments on request->tensor cleanup

d03c791

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Address precommit

bd4b5ee

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Change config to msgspec|torch instead of boolean

e37a2c8

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

remove None typing for multimodal_tensor_ipc

b1f6aa5

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

Change to direct_rpc and torch_shm, dataclass -> NamedTuple+tuple dat…

6aa1e3d

…atype, cleanup on scheduler finished_req_ids Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

precommit issues resolved

8a8a7b8

Signed-off-by: Brandon Pelfrey <bpelfrey@nvidia.com>

soodoshll added 4 commits February 5, 2026 17:07

upd

852e13f

upd

7713eaf

upd

d5c1780

upd

517e7e4

soodoshll force-pushed the nvimgcodec-ipc branch from a4046db to 517e7e4 Compare February 5, 2026 22:07

fix

c5e2df1

soodoshll requested a review from wangshangsam February 9, 2026 02:57

wangshangsam approved these changes Feb 9, 2026

View reviewed changes

wangshangsam merged commit bf71fe5 into CentML:mlperf-inf-mm-q3vl-v6.0 Feb 9, 2026
1 check passed

wangshangsam added a commit that referenced this pull request Feb 10, 2026

Revert "Nvimgcodec + tensor ipc (#38)"

2708751

This reverts commit bf71fe5.

wangshangsam added a commit that referenced this pull request Feb 10, 2026

Revert "Nvimgcodec + tensor ipc (#38)" (#43)

6c10918

This reverts commit bf71fe5.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Nvimgcodec + tensor ipc #38

Nvimgcodec + tensor ipc #38

Uh oh!

soodoshll commented Feb 5, 2026 •

edited by github-actions bot

Loading

Uh oh!

soodoshll commented Feb 5, 2026 •

edited

Loading

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Nvimgcodec + tensor ipc #38

Nvimgcodec + tensor ipc #38

Uh oh!

Conversation

soodoshll commented Feb 5, 2026 • edited by github-actions bot Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

soodoshll commented Feb 5, 2026 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

soodoshll commented Feb 5, 2026 •

edited by github-actions bot

Loading

soodoshll commented Feb 5, 2026 •

edited

Loading