sivanov-work · sivanov-work · Aug 20, 2021 · Aug 23, 2021 · Aug 24, 2021 · Aug 25, 2021
diff --git a/modules/gapi/CMakeLists.txt b/modules/gapi/CMakeLists.txt
@@ -177,10 +177,13 @@ if(HAVE_GAPI_ONEVPL)
         src/streaming/onevpl/onevpl_cfg_params.cpp
         src/streaming/onevpl/onevpl_data_provider_interface_exception.cpp
         src/streaming/onevpl/accelerators/surface/cpu_frame_adapter.cpp
+        src/streaming/onevpl/accelerators/surface/dx11_frame_adapter.cpp
         src/streaming/onevpl/accelerators/surface/surface.cpp
         src/streaming/onevpl/accelerators/surface/surface_pool.cpp
+        src/streaming/onevpl/accelerators/utils/shared_lock.cpp
         src/streaming/onevpl/accelerators/accel_policy_cpu.cpp
         src/streaming/onevpl/accelerators/accel_policy_dx11.cpp
+        src/streaming/onevpl/accelerators/dx11_alloc_resource.cpp
 
         src/streaming/onevpl/engine/engine_session.cpp
         src/streaming/onevpl/engine/processing_engine_base.cpp

diff --git a/modules/gapi/perf/streaming/gapi_streaming_source_perf_tests.cpp b/modules/gapi/perf/streaming/gapi_streaming_source_perf_tests.cpp
@@ -26,7 +26,8 @@ const std::string codec[] = {
 
 using source_t = std::string;
 using codec_t = std::string;
-using source_description_t = std::tuple<source_t, codec_t>;
+using accel_mode_t = std::string;
+using source_description_t = std::tuple<source_t, codec_t, accel_mode_t>;
 
 class OneVPLSourcePerfTest : public TestPerfParams<source_description_t> {};
 class VideoCapSourcePerfTest : public TestPerfParams<source_t> {};
@@ -38,12 +39,16 @@ PERF_TEST_P_(OneVPLSourcePerfTest, TestPerformance)
   const auto params = GetParam();
   source_t src = findDataFile(get<0>(params));
   codec_t type = get<1>(params);
+  accel_mode_t mode = get<2>(params);
 
   std::vector<oneVPL_cfg_param> cfg_params {
       oneVPL_cfg_param::create<std::string>("mfxImplDescription.Impl", "MFX_IMPL_TYPE_HARDWARE"),
       oneVPL_cfg_param::create("mfxImplDescription.mfxDecoderDescription.decoder.CodecID", type),
   };
 
+  if (!mode.empty()) {
+      cfg_params.push_back(oneVPL_cfg_param::create("mfxImplDescription.AccelerationMode", mode));
+  }
   auto source_ptr = make_vpl_src(src, cfg_params);
   Data out;
   TEST_CYCLE()
@@ -70,8 +75,10 @@ PERF_TEST_P_(VideoCapSourcePerfTest, TestPerformance)
 }
 
 INSTANTIATE_TEST_CASE_P(Streaming, OneVPLSourcePerfTest,
-                        Values(source_description_t(files[0], codec[0]),
-                               source_description_t(files[1], codec[1])));
+                        Values(source_description_t(files[0], codec[0], ""),
+                               source_description_t(files[0], codec[0], "MFX_ACCEL_MODE_VIA_D3D11"),
+                               source_description_t(files[1], codec[1], ""),
+                               source_description_t(files[1], codec[1], "MFX_ACCEL_MODE_VIA_D3D11")));
 
 INSTANTIATE_TEST_CASE_P(Streaming, VideoCapSourcePerfTest,
                         Values(files[0],

diff --git a/modules/gapi/src/backends/render/grenderocv.cpp b/modules/gapi/src/backends/render/grenderocv.cpp
@@ -4,6 +4,7 @@
 
 #include <opencv2/gapi/cpu/gcpukernel.hpp>
 #include <opencv2/gapi/fluid/core.hpp>
+#include "logger.hpp"
 
 struct RenderOCVState
 {
@@ -128,15 +129,13 @@ GAPI_OCV_KERNEL_ST(RenderFrameOCVImpl, cv::gapi::wip::draw::GRenderFrame, Render
         out = in;
 
         auto desc = out.desc();
-        auto w_out = out.access(cv::MediaFrame::Access::W);
 
-        auto out_y = cv::Mat(desc.size, CV_8UC1, w_out.ptr[0], w_out.stride[0]);
-        auto out_uv = cv::Mat(desc.size / 2, CV_8UC2, w_out.ptr[1], w_out.stride[1]);
-
-        auto r_in = in.access(cv::MediaFrame::Access::R);
+        cv::Mat upsample_uv, yuv;
+        {
+            auto r_in = in.access(cv::MediaFrame::Access::R);
 
-        auto in_y = cv::Mat(desc.size, CV_8UC1, r_in.ptr[0], r_in.stride[0]);
-        auto in_uv = cv::Mat(desc.size / 2, CV_8UC2, r_in.ptr[1], r_in.stride[1]);
+            auto in_y = cv::Mat(desc.size, CV_8UC1, r_in.ptr[0], r_in.stride[0]);
+            auto in_uv = cv::Mat(desc.size / 2, CV_8UC2, r_in.ptr[1], r_in.stride[1]);
 
         /* FIXME How to render correctly on NV12 format ?
          *
@@ -157,19 +156,26 @@ GAPI_OCV_KERNEL_ST(RenderFrameOCVImpl, cv::gapi::wip::draw::GRenderFrame, Render
          *
          */
 
-         // NV12 -> YUV
-        cv::Mat upsample_uv, yuv;
-        cv::resize(in_uv, upsample_uv, in_uv.size() * 2, cv::INTER_LINEAR);
-        cv::merge(std::vector<cv::Mat>{in_y, upsample_uv}, yuv);
+            // NV12 -> YUV
+            cv::resize(in_uv, upsample_uv, in_uv.size() * 2, cv::INTER_LINEAR);
+            cv::merge(std::vector<cv::Mat>{in_y, upsample_uv}, yuv);
+        }
 
         cv::gapi::wip::draw::drawPrimitivesOCVYUV(yuv, prims, state.ftpr);
 
         // YUV -> NV12
-        cv::Mat out_u, out_v, uv_plane;
-        std::vector<cv::Mat> chs = { out_y, out_u, out_v };
-        cv::split(yuv, chs);
-        cv::merge(std::vector<cv::Mat>{chs[1], chs[2]}, uv_plane);
-        cv::resize(uv_plane, out_uv, uv_plane.size() / 2, cv::INTER_LINEAR);
+        {
+            auto w_out = out.access(cv::MediaFrame::Access::W);
+
+            auto out_y = cv::Mat(desc.size, CV_8UC1, w_out.ptr[0], w_out.stride[0]);
+            auto out_uv = cv::Mat(desc.size / 2, CV_8UC2, w_out.ptr[1], w_out.stride[1]);
+
+            cv::Mat out_u, out_v, uv_plane;
+            std::vector<cv::Mat> chs = { out_y, out_u, out_v };
+            cv::split(yuv, chs);
+            cv::merge(std::vector<cv::Mat>{chs[1], chs[2]}, uv_plane);
+            cv::resize(uv_plane, out_uv, uv_plane.size() / 2, cv::INTER_LINEAR);
+        }
     }
 
     static void setup(const cv::GFrameDesc&   /* in_nv12  */,

diff --git a/modules/gapi/src/streaming/onevpl/accelerators/accel_policy_cpu.cpp b/modules/gapi/src/streaming/onevpl/accelerators/accel_policy_cpu.cpp
@@ -21,6 +21,98 @@
 namespace cv {
 namespace gapi {
 namespace wip {
+namespace utils {
+    /* UTILS */
+mfxU32 GetSurfaceSize_(mfxU32 FourCC, mfxU32 width, mfxU32 height) {
+    mfxU32 nbytes = 0;
+
+    mfxU32 half_width = width / 2;
+    mfxU32 half_height = height / 2;
+    switch (FourCC) {
+        case MFX_FOURCC_I420:
+        case MFX_FOURCC_NV12:
+            nbytes = width * height +  2 * half_width * half_height;
+            break;
+        case MFX_FOURCC_I010:
+        case MFX_FOURCC_P010:
+            nbytes = width * height + 2 * half_width * half_height;
+            nbytes *= 2;
+            break;
+        case MFX_FOURCC_RGB4:
+            nbytes = width * height * 4;
+            break;
+        default:
+            break;
+    }
+
+    return nbytes;
+}
+
+surface_ptr_t create_surface_RGB4_(mfxFrameInfo frameInfo,
+                                  std::shared_ptr<void> out_buf_ptr,
+                                  size_t out_buf_ptr_offset,
+                                  size_t out_buf_size)
+{
+    mfxU8* buf = reinterpret_cast<mfxU8*>(out_buf_ptr.get());
+    mfxU16 surfW = frameInfo.Width * 4;
+    mfxU16 surfH = frameInfo.Height;
+    (void)surfH;
+
+    // TODO more intelligent check
+    if (out_buf_size <= out_buf_ptr_offset) {
+        GAPI_LOG_WARNING(nullptr, "Not enough buffer, ptr: " << out_buf_ptr <<
+                                  ", size: " << out_buf_size <<
+                                  ", offset: " << out_buf_ptr_offset <<
+                                  ", W: " << surfW <<
+                                  ", H: " << surfH);
+        GAPI_Assert(false && "Invalid offset");
+    }
+
+    std::unique_ptr<mfxFrameSurface1> handle(new mfxFrameSurface1);
+    memset(handle.get(), 0, sizeof(mfxFrameSurface1));
+
+    handle->Info = frameInfo;
+    handle->Data.B = buf + out_buf_ptr_offset;
+    handle->Data.G = handle->Data.B + 1;
+    handle->Data.R = handle->Data.B + 2;
+    handle->Data.A = handle->Data.B + 3;
+    handle->Data.Pitch = surfW;
+
+    return Surface::create_surface(std::move(handle), out_buf_ptr);
+}
+
+surface_ptr_t create_surface_other_(mfxFrameInfo frameInfo,
+                                   std::shared_ptr<void> out_buf_ptr,
+                                   size_t out_buf_ptr_offset,
+                                   size_t out_buf_size)
+{
+    mfxU8* buf = reinterpret_cast<mfxU8*>(out_buf_ptr.get());
+    mfxU16 surfH = frameInfo.Height;
+    mfxU16 surfW = (frameInfo.FourCC == MFX_FOURCC_P010) ? frameInfo.Width * 2 : frameInfo.Width;
+
+    // TODO more intelligent check
+    if (out_buf_size <=
+        out_buf_ptr_offset + (surfW * surfH) + ((surfW / 2) * (surfH / 2))) {
+        GAPI_LOG_WARNING(nullptr, "Not enough buffer, ptr: " << out_buf_ptr <<
+                                  ", size: " << out_buf_size <<
+                                  ", offset: " << out_buf_ptr_offset <<
+                                  ", W: " << surfW <<
+                                  ", H: " << surfH);
+        GAPI_Assert(false && "Invalid offset");
+    }
+
+    std::unique_ptr<mfxFrameSurface1> handle(new mfxFrameSurface1);
+    memset(handle.get(), 0, sizeof(mfxFrameSurface1));
+
+    handle->Info = frameInfo;
+    handle->Data.Y     = buf + out_buf_ptr_offset;
+    handle->Data.U     = buf + out_buf_ptr_offset + (surfW * surfH);
+    handle->Data.V     = handle->Data.U + ((surfW / 2) * (surfH / 2));
+    handle->Data.Pitch = surfW;
+
+    return Surface::create_surface(std::move(handle), out_buf_ptr);
+}
+} // namespace utils
 
 VPLCPUAccelerationPolicy::VPLCPUAccelerationPolicy() {
     GAPI_LOG_INFO(nullptr, "created");
@@ -35,6 +127,10 @@ VPLCPUAccelerationPolicy::~VPLCPUAccelerationPolicy() {
     GAPI_LOG_INFO(nullptr, "destroyed");
 }
 
+VPLAccelerationPolicy::AccelType VPLCPUAccelerationPolicy::get_accel_type() const {
+    return AccelType::CPU;
+}
+
 void VPLCPUAccelerationPolicy::init(session_t session) {
     (void)session;
     //MFXVideoCORE_SetFrameAllocator(session, mfxFrameAllocator instance)
@@ -120,6 +216,38 @@ VPLCPUAccelerationPolicy::create_surface_pool(size_t pool_size, size_t surface_s
 
     return preallocated_pool_memory_ptr;
 }
+VPLCPUAccelerationPolicy::pool_key_t
+VPLCPUAccelerationPolicy::create_surface_pool(const mfxFrameAllocRequest& alloc_request, mfxVideoParam& param) {
+
+// External (application) allocation of decode surfaces
+    GAPI_LOG_DEBUG(nullptr, "Query mfxFrameAllocRequest.NumFrameSuggested: " << alloc_request.NumFrameSuggested <<
+                            ", mfxFrameAllocRequest.Type: " << alloc_request.Type);
+
+    mfxU32 singleSurfaceSize = utils::GetSurfaceSize_(param.mfx.FrameInfo.FourCC,
+                                                      param.mfx.FrameInfo.Width,
+                                                      param.mfx.FrameInfo.Height);
+    if (!singleSurfaceSize) {
+        throw std::runtime_error("Cannot determine surface size for: fourCC" +
+                                 std::to_string(param.mfx.FrameInfo.FourCC) +
+                                 ", width: " + std::to_string(param.mfx.FrameInfo.Width) +
+                                 ", height: " + std::to_string(param.mfx.FrameInfo.Height));
+    }
+
+    const auto &frameInfo = param.mfx.FrameInfo;
+    auto surface_creator =
+            [&frameInfo] (std::shared_ptr<void> out_buf_ptr, size_t out_buf_ptr_offset,
+                          size_t out_buf_size) -> surface_ptr_t {
+                return (frameInfo.FourCC == MFX_FOURCC_RGB4) ?
+                        utils::create_surface_RGB4_(frameInfo, out_buf_ptr, out_buf_ptr_offset,
+                                                    out_buf_size) :
+                        utils::create_surface_other_(frameInfo, out_buf_ptr, out_buf_ptr_offset,
+                                                     out_buf_size);};
+
+    //TODO Configure preallocation size (how many frames we can hold)
+    const size_t preallocated_frames_count = 30;
+    return create_surface_pool(alloc_request.NumFrameSuggested * preallocated_frames_count,
+                               singleSurfaceSize, surface_creator);
+}
 
 VPLCPUAccelerationPolicy::surface_weak_ptr_t VPLCPUAccelerationPolicy::get_free_surface(pool_key_t key) {
     auto pool_it = pool_table.find(key);

diff --git a/modules/gapi/src/streaming/onevpl/accelerators/accel_policy_cpu.hpp b/modules/gapi/src/streaming/onevpl/accelerators/accel_policy_cpu.hpp
@@ -29,9 +29,11 @@ struct VPLCPUAccelerationPolicy final : public VPLAccelerationPolicy
 
     using pool_t = CachedPool;
 
+    GAPI_EXPORTS AccelType get_accel_type() const override;
     GAPI_EXPORTS void init(session_t session) override;
     GAPI_EXPORTS void deinit(session_t session) override;
-    GAPI_EXPORTS pool_key_t create_surface_pool(size_t pool_size, size_t surface_size_bytes, surface_ptr_ctr_t creator) override;
+    GAPI_EXPORTS pool_key_t create_surface_pool(size_t pool_size, size_t surface_size_bytes, surface_ptr_ctr_t creator);
+    GAPI_EXPORTS pool_key_t create_surface_pool(const mfxFrameAllocRequest& alloc_request, mfxVideoParam& param) override;
     GAPI_EXPORTS surface_weak_ptr_t get_free_surface(pool_key_t key) override;
     GAPI_EXPORTS size_t get_free_surface_count(pool_key_t key) const override;
     GAPI_EXPORTS size_t get_surface_count(pool_key_t key) const override;