[MO] Optimize redundant Concat in GRUBlockCell conversion (#12078)

* Optimize redundant Concat in GRUBlockCell conversion * Imports and code refactor * Update comments * Update rename and remove nodes * Update import
2022-08-19 10:37:14 +02:00 · 2022-08-19 10:37:14 +02:00 · 6fd23416d4
commit 6fd23416d4
parent e6e901bdcf
1 changed files with 35 additions and 59 deletions
--- a/tools/mo/openvino/tools/mo/front/tf/GRUBlockCellReplacement.py
+++ b/tools/mo/openvino/tools/mo/front/tf/GRUBlockCellReplacement.py
@ -1,101 +1,77 @@
 # Copyright (C) 2018-2022 Intel Corporation
 # SPDX-License-Identifier: Apache-2.0

-from openvino.tools.mo.front.common.replacement import FrontReplacementPattern
 from openvino.tools.mo.front.common.partial_infer.utils import int64_array
+from openvino.tools.mo.front.common.replacement import FrontReplacementPattern
 from openvino.tools.mo.front.tf.graph_utils import create_op_node_with_second_input
-from openvino.tools.mo.graph.graph import Graph, rename_node
-from openvino.tools.mo.ops.GRUCell import GRUCell
+from openvino.tools.mo.graph.graph import Graph, rename_nodes
 from openvino.tools.mo.ops.concat import Concat
+from openvino.tools.mo.ops.GRUCell import GRUCell
 from openvino.tools.mo.ops.split import AttributedSplit
 from openvino.tools.mo.ops.transpose import Transpose


 class GRUBlockCellToGRUCell(FrontReplacementPattern):
-
+    """
+    This transformation converts TF GRUBlockCell to mo.ops.GRUCell
+    by alignment of weights and bias inputs.
+    """
    enabled = True

    def find_and_replace_pattern(self, graph: Graph):
        for tf_gru_block_cell in graph.get_op_nodes(op='GRUBlockCell'):
            original_name = tf_gru_block_cell.soft_get('name', tf_gru_block_cell.id)
-            tf_gru_block_cell['name'] = original_name + '/to_be_removed'
-
            new_gru_cell = GRUCell(graph, {}).create_node()
-            rename_node(new_gru_cell, original_name)
+            rename_nodes([(tf_gru_block_cell, original_name + '/to_be_removed'), (new_gru_cell, original_name)])

+            # Connect X data port
            tf_gru_block_cell.in_port(0).get_connection().set_destination(new_gru_cell.in_port(0))
+            # Connect hidden state port
            tf_gru_block_cell.in_port(1).get_connection().set_destination(new_gru_cell.in_port(1))

-            concat_w = Concat(graph, {'name': original_name + '/Concat_W',
-                                        'axis': 1}).create_node()
-
-            concat_w.add_input_port(0)
-            concat_w.add_input_port(1)
-
-            concat_b = Concat(graph, {'name': original_name + '/Concat_B',
-                                                   'axis': 0}).create_node()
-
-            concat_b.add_input_port(0)
-            concat_b.add_input_port(1)
-
-            tf_gru_block_cell.in_port(2).get_connection().set_destination(concat_w.in_port(0))
-            tf_gru_block_cell.in_port(3).get_connection().set_destination(concat_w.in_port(1))
-
-            tf_gru_block_cell.in_port(4).get_connection().set_destination(concat_b.in_port(0))
-            tf_gru_block_cell.in_port(5).get_connection().set_destination(concat_b.in_port(1))
-
            # W (Weights)
            # z - update, r - reset, h - hidden
-            # Convert gate order "rzh" -> "zrh"
-            split_rzh_w = AttributedSplit(graph, {'name': original_name + '/Split_rzh_W', 'axis': 1, 'num_splits': 3}).create_node()
+            # Convert gate order W_rz, W_h -> W_zrh
+            split_rz_w = AttributedSplit(graph, {'name': original_name + '/Split_W_rz', 'axis': 1, 'num_splits': 2}).create_node()

-            split_rzh_w.out_port(1)
-            concat_zrh_w = Concat(graph, {'name': original_name + '/Concat_zrh_W',
-                                                   'axis': 1}).create_node()
-            concat_zrh_w.add_input_port(0)
-            concat_zrh_w.add_input_port(1)
-            concat_zrh_w.add_input_port(2)
+            # Split W_rz to W_r and W_z
+            tf_gru_block_cell.in_port(2).get_connection().set_destination(split_rz_w.in_port(0))

-            # r at 0 -> r at 1
-            split_rzh_w.out_port(0).connect(concat_zrh_w.in_port(1))
+            concat_zrh_w = Concat(graph, {'name': original_name + '/Concat_W_zrh', 'in_ports_count': 3,
+                                          'axis': 1}).create_node()

-            # z at 1 -> z at 0
-            split_rzh_w.out_port(1).connect(concat_zrh_w.in_port(0))
+            # Swap and concat gates: W_rz -> W_zr
+            split_rz_w.out_port(0).connect(concat_zrh_w.in_port(1))
+            split_rz_w.out_port(1).connect(concat_zrh_w.in_port(0))

-            # h at 2 -> h at 2
-            split_rzh_w.out_port(2).connect(concat_zrh_w.in_port(2))
-
-            concat_w.out_port(0).connect(split_rzh_w.in_port(0))
+            # Conncat W_h gate: W_zr -> W_zrh
+            tf_gru_block_cell.in_port(3).get_connection().set_destination(concat_zrh_w.in_port(2))

            # B (Bias)
            # z - update, r - reset, h - hidden
-            # Convert gate order "rzh" -> "zrh"
-            split_rzh_b = AttributedSplit(graph, {'name': original_name + '/Split_rzh_B', 'axis': 0, 'num_splits': 3}).create_node()
+            # Convert gate order B_rz, B_h -> B_zrh
+            split_rz_b = AttributedSplit(graph, {'name': original_name + '/Split_B_rz', 'axis': 0, 'num_splits': 2}).create_node()

-            split_rzh_b.out_port(1)
-            concat_zrh_b = Concat(graph, {'name': original_name + '/Concat_zrh_B',
-                                                   'axis': 0}).create_node()
-            concat_zrh_b.add_input_port(0)
-            concat_zrh_b.add_input_port(1)
-            concat_zrh_b.add_input_port(2)
+            # Split B_rz to B_r and B_z
+            tf_gru_block_cell.in_port(4).get_connection().set_destination(split_rz_b.in_port(0))

-            # r at 0 -> r at 1
-            split_rzh_b.out_port(0).connect(concat_zrh_b.in_port(1))
+            concat_zrh_b = Concat(graph, {'name': original_name + '/Concat_B_zrh', 'in_ports_count': 3,
+                                          'axis': 0}).create_node()

-            # z at 1 -> z at 0
-            split_rzh_b.out_port(1).connect(concat_zrh_b.in_port(0))
+            # Swap and concat gates: B_rz -> B_zr
+            split_rz_b.out_port(0).connect(concat_zrh_b.in_port(1))
+            split_rz_b.out_port(1).connect(concat_zrh_b.in_port(0))

-            # h at 2 -> h at 2
-            split_rzh_b.out_port(2).connect(concat_zrh_b.in_port(2))
-
-            concat_b.out_port(0).connect(split_rzh_b.in_port(0))
+            # Concat B_h gate: B_zr -> B_zrh
+            tf_gru_block_cell.in_port(5).get_connection().set_destination(concat_zrh_b.in_port(2))

+            # Transpose W Shape [input_size + hidden_size, 3 * hidden_size] to [3 * hidden_size, input_size + hidden_size]
            permute_order = int64_array([1, 0])
            transpose_w = create_op_node_with_second_input(graph, Transpose, permute_order,
-                                                          dict(name=original_name + 'Transpose_W'), concat_zrh_w)
+                                                          dict(name=original_name + '/Transpose_W'), concat_zrh_w)

            transpose_w.out_port(0).connect(new_gru_cell.in_port(2))
            concat_zrh_b.out_port(0).connect(new_gru_cell.in_port(3))

            tf_gru_block_cell.out_port(3).get_connection().set_source(new_gru_cell.out_port(0))
-            graph.remove_node(tf_gru_block_cell.id)
+            graph.remove_nodes_from([tf_gru_block_cell.id])