[GNA] Added support of FQ layers for outputs (#6999)

* [GNA] Added support of FQ layers for outputs (#6905) * [GNA] Fixed FQ pass for several outputs * Added tests
2021-08-12 22:54:02 +03:00
parent 2f48787fc4
commit 3117879c54
3 changed files with 142 additions and 2 deletions
--- a/inference-engine/src/gna_plugin/backend/dnn.hpp
+++ b/inference-engine/src/gna_plugin/backend/dnn.hpp
@@ -58,7 +58,8 @@ void AdvanceCnnOperationIfAllApplied(const std::vector<intel_dnn_component_t>& c

 template <class T>
 void AdvancePwlOperationIfAllApplied(const std::vector<intel_dnn_component_t>& component, int i, T*& operation) {
-    if (i == component.size() - 1 || (component[i + 1].operation != kDnnMaxPoolOp)) {
+    if (i == component.size() - 1 || ((component[i + 1].operation != kDnnMaxPoolOp)
+                                      && (component[i + 1].operation != kDnnPiecewiselinearOp))) {
        operation++;
    }
 }
--- a/inference-engine/src/gna_plugin/optimizer/gna_pass_manager.cpp
+++ b/inference-engine/src/gna_plugin/optimizer/gna_pass_manager.cpp
@@ -2241,7 +2241,7 @@ void MoveFakeQuantizeLayerIntoQuantParamsPass :: run() {
        // Find all output layers connected to FQ
        auto nextLayers = CNNNetGetAllNextLayersSkipCertain(*fqLayer, -1, donotSkip);
        if (nextLayers.empty()) {
-            return;
+            continue;
        }

        if (isFQFuseAllowed) {
--- a/inference-engine/tests/functional/plugin/gna/pass_tests/fq_outputs_activation_.cpp
+++ b/inference-engine/tests/functional/plugin/gna/pass_tests/fq_outputs_activation_.cpp
@@ -0,0 +1,139 @@
+// Copyright (C) 2018-2021 Intel Corporation
+// SPDX-License-Identifier: Apache-2.0
+//
+
+#include <vector>
+#include <memory>
+#include <tuple>
+#include <vector>
+#include <string>
+
+#include <ie_core.hpp>
+
+#include "common_test_utils/common_utils.hpp"
+#include "functional_test_utils/plugin_cache.hpp"
+#include "shared_test_classes/base/layer_test_utils.hpp"
+#include "functional_test_utils/blob_utils.hpp"
+#include "ngraph_functions/utils/ngraph_helpers.hpp"
+#include "ngraph_functions/builders.hpp"
+
+#include "ngraph_functions/pass/convert_prc.hpp"
+
+typedef std::tuple<
+    InferenceEngine::Precision,         // Network Precision
+    std::string,                        // Target Device
+    std::map<std::string, std::string>, // Configuration
+    std::vector<size_t>,                // Input Shape
+    std::pair<float, float>,            // Input Min and Max
+    size_t,                             // Levels
+    size_t                              // Outputs
+> fqOutputsActivationParams;
+
+namespace LayerTestsDefinitions {
+
+class FQOutputsActivation : public testing::WithParamInterface<fqOutputsActivationParams>,
+    public LayerTestsUtils::LayerTestsCommon {
+    float inputDataMin = 0.0f;
+    float inputDataMax = 0.0f;
+    float inputDataResolution = 1.0f;
+
+public:
+    static std::string getTestCaseName(testing::TestParamInfo<fqOutputsActivationParams> obj) {
+        InferenceEngine::Precision netPrecision;
+        std::string targetDevice;
+        std::map<std::string, std::string> configuration;
+        std::vector<size_t> inputShape;
+        std::pair<float, float> inputMinMax;
+        size_t levels = 0;
+        size_t outputCount = 1;
+        std::tie(netPrecision, targetDevice, configuration, inputShape, inputMinMax, levels, outputCount) = obj.param;
+
+        std::ostringstream result;
+        result << "netPRC=" << netPrecision.name() << "_";
+        result << "targetDevice=" << targetDevice << "_";
+        for (auto const& configItem : configuration) {
+            result << "_configItem=" << configItem.first << "_" << configItem.second;
+        }
+        result << "_inputShape=" << CommonTestUtils::vec2str(inputShape);
+        result << "_inputMinMax=(" << inputMinMax.first << ".." << inputMinMax.second << ")";
+        result << "_levels=" << levels;
+        result << "_outputs=" << outputCount;
+
+        return result.str();
+    }
+
+    InferenceEngine::Blob::Ptr GenerateInput(const InferenceEngine::InputInfo& info) const override {
+        return FuncTestUtils::createAndFillBlob(info.getTensorDesc(), inputDataMax - inputDataMin, inputDataMin, 1 / inputDataResolution);
+    }
+
+protected:
+    void SetUp() override {
+        InferenceEngine::Precision netPrecision;
+        std::vector<size_t> inputShape;
+        std::pair<float, float> inputMinMax;
+        size_t levels = 0;
+        size_t outputCount = 1;
+        std::tie(netPrecision, targetDevice, configuration, inputShape, inputMinMax, levels, outputCount) = this->GetParam();
+        auto ngPrc = FuncTestUtils::PrecisionUtils::convertIE2nGraphPrc(netPrecision);
+
+        auto inputLowNode = ngraph::builder::makeConstant<float>(ngPrc, { 1 }, { inputMinMax.first });
+        auto inputHighNode = ngraph::builder::makeConstant<float>(ngPrc, { 1 }, { inputMinMax.second });
+        auto inputVector = ngraph::builder::makeParams(ngPrc, { inputShape });
+        auto split = ngraph::builder::makeSplit(inputVector[0], ngPrc, outputCount, 1);
+
+        ngraph::ResultVector results;
+        for (size_t i = 0; i < outputCount; ++i) {
+            auto relu = ngraph::builder::makeActivation(split->output(i), ngraph::element::f32, ngraph::helpers::ActivationTypes::Sigmoid);
+            auto reluFQNode = std::make_shared<ngraph::opset7::FakeQuantize>(relu,
+                inputLowNode, inputHighNode, inputLowNode, inputHighNode, levels);
+            results.push_back(std::make_shared<ngraph::opset7::Result>(reluFQNode));
+        }
+        function = std::make_shared<ngraph::Function>(results, inputVector, "FQOutputsActivation");
+    }
+};
+
+
+TEST_P(FQOutputsActivation, CompareWithRefImpl) {
+    Run();
+};
+
+const std::vector<InferenceEngine::Precision> netPrecisions = {
+    InferenceEngine::Precision::FP32,
+    InferenceEngine::Precision::FP16
+};
+
+const std::vector<std::map<std::string, std::string>> configs = {
+    {
+        {"GNA_DEVICE_MODE", "GNA_SW_EXACT"},
+    }
+};
+
+const std::vector<std::vector<size_t>> inputShape = {
+    {1, 2048},
+};
+
+const std::vector<std::pair<float, float>> inputMinMax = {
+    {-0.5, 0.5},
+    {-16, 16},
+    {-100, 100},
+};
+
+const std::vector<size_t> levels = {
+    65535,
+};
+
+const std::vector<size_t> outputCount = {
+    1, 2, 4
+};
+
+INSTANTIATE_TEST_CASE_P(smoke_fq_activation, FQOutputsActivation,
+    ::testing::Combine(
+        ::testing::ValuesIn(netPrecisions),
+        ::testing::Values(CommonTestUtils::DEVICE_GNA),
+        ::testing::ValuesIn(configs),
+        ::testing::ValuesIn(inputShape),
+        ::testing::ValuesIn(inputMinMax),
+        ::testing::ValuesIn(levels),
+        ::testing::ValuesIn(outputCount)),
+    FQOutputsActivation::getTestCaseName);
+} // namespace LayerTestsDefinitions