diff --git a/mindspore/ops/_op_impl/akg/gpu/equal.py b/mindspore/ops/_op_impl/akg/gpu/equal.py
index c63988f202..b9d113fd96 100644
--- a/mindspore/ops/_op_impl/akg/gpu/equal.py
+++ b/mindspore/ops/_op_impl/akg/gpu/equal.py
@@ -23,6 +23,9 @@ equal_op_info = AkgGpuRegOp("Equal") \
     .dtype_format(DataType.F16_Default, DataType.F16_Default, DataType.BOOL_Default) \
     .dtype_format(DataType.F32_Default, DataType.F32_Default, DataType.BOOL_Default) \
     .dtype_format(DataType.I32_Default, DataType.I32_Default, DataType.BOOL_Default) \
+    .dtype_format(DataType.I16_Default, DataType.I16_Default, DataType.BOOL_Default) \
+    .dtype_format(DataType.U8_Default, DataType.U8_Default, DataType.BOOL_Default) \
+    .dtype_format(DataType.BOOL_Default, DataType.BOOL_Default, DataType.BOOL_Default) \
     .get_op_info()
 
 
diff --git a/mindspore/ops/_op_impl/akg/gpu/greater_equal.py b/mindspore/ops/_op_impl/akg/gpu/greater_equal.py
index 666c939b4b..7a2f2da3b2 100644
--- a/mindspore/ops/_op_impl/akg/gpu/greater_equal.py
+++ b/mindspore/ops/_op_impl/akg/gpu/greater_equal.py
@@ -23,6 +23,8 @@ greater_equal_op_info = AkgGpuRegOp("GreaterEqual") \
     .dtype_format(DataType.F16_Default, DataType.F16_Default, DataType.BOOL_Default) \
     .dtype_format(DataType.F32_Default, DataType.F32_Default, DataType.BOOL_Default) \
     .dtype_format(DataType.I32_Default, DataType.I32_Default, DataType.BOOL_Default) \
+    .dtype_format(DataType.I16_Default, DataType.I16_Default, DataType.BOOL_Default) \
+    .dtype_format(DataType.U8_Default, DataType.U8_Default, DataType.BOOL_Default) \
     .get_op_info()
 
 
diff --git a/mindspore/ops/_op_impl/akg/gpu/lessequal.py b/mindspore/ops/_op_impl/akg/gpu/lessequal.py
index 58c9c7f90a..54ce2bcec2 100644
--- a/mindspore/ops/_op_impl/akg/gpu/lessequal.py
+++ b/mindspore/ops/_op_impl/akg/gpu/lessequal.py
@@ -23,6 +23,8 @@ lessequal_op_info = AkgGpuRegOp("LessEqual") \
     .dtype_format(DataType.F16_Default, DataType.F16_Default, DataType.BOOL_Default) \
     .dtype_format(DataType.F32_Default, DataType.F32_Default, DataType.BOOL_Default) \
     .dtype_format(DataType.I32_Default, DataType.I32_Default, DataType.BOOL_Default) \
+    .dtype_format(DataType.I16_Default, DataType.I16_Default, DataType.BOOL_Default) \
+    .dtype_format(DataType.U8_Default, DataType.U8_Default, DataType.BOOL_Default) \
     .get_op_info()
 
 
diff --git a/mindspore/ops/_op_impl/akg/gpu/notequal.py b/mindspore/ops/_op_impl/akg/gpu/notequal.py
index b9c9c55faf..c70b641926 100644
--- a/mindspore/ops/_op_impl/akg/gpu/notequal.py
+++ b/mindspore/ops/_op_impl/akg/gpu/notequal.py
@@ -23,6 +23,9 @@ notequal_op_info = AkgGpuRegOp("NotEqual") \
     .dtype_format(DataType.F16_Default, DataType.F16_Default, DataType.BOOL_Default) \
     .dtype_format(DataType.F32_Default, DataType.F32_Default, DataType.BOOL_Default) \
     .dtype_format(DataType.I32_Default, DataType.I32_Default, DataType.BOOL_Default) \
+    .dtype_format(DataType.I16_Default, DataType.I16_Default, DataType.BOOL_Default) \
+    .dtype_format(DataType.U8_Default, DataType.U8_Default, DataType.BOOL_Default) \
+    .dtype_format(DataType.BOOL_Default, DataType.BOOL_Default, DataType.BOOL_Default) \
     .get_op_info()
 
 
diff --git a/mindspore/ops/_op_impl/akg/gpu/squeeze.py b/mindspore/ops/_op_impl/akg/gpu/squeeze.py
index 8761b64890..c2bd291f52 100644
--- a/mindspore/ops/_op_impl/akg/gpu/squeeze.py
+++ b/mindspore/ops/_op_impl/akg/gpu/squeeze.py
@@ -22,6 +22,10 @@ squeeze_op_info = AkgGpuRegOp("Squeeze") \
     .attr("axis", "optional", "listInt") \
     .dtype_format(DataType.F16_Default, DataType.F16_Default) \
     .dtype_format(DataType.F32_Default, DataType.F32_Default) \
+    .dtype_format(DataType.I32_Default, DataType.I32_Default) \
+    .dtype_format(DataType.I16_Default, DataType.I16_Default) \
+    .dtype_format(DataType.U8_Default, DataType.U8_Default) \
+    .dtype_format(DataType.BOOL_Default, DataType.BOOL_Default) \
     .get_op_info()
 
 
diff --git a/mindspore/ops/_op_impl/akg/gpu/squeeze_grad.py b/mindspore/ops/_op_impl/akg/gpu/squeeze_grad.py
index 41eacbf18f..14e92cb757 100644
--- a/mindspore/ops/_op_impl/akg/gpu/squeeze_grad.py
+++ b/mindspore/ops/_op_impl/akg/gpu/squeeze_grad.py
@@ -22,6 +22,10 @@ squeeze_grad_op_info = AkgGpuRegOp("SqueezeGrad") \
     .attr("x_shape", "required", "listInt") \
     .dtype_format(DataType.F16_Default, DataType.F16_Default) \
     .dtype_format(DataType.F32_Default, DataType.F32_Default) \
+    .dtype_format(DataType.I32_Default, DataType.I32_Default) \
+    .dtype_format(DataType.I16_Default, DataType.I16_Default) \
+    .dtype_format(DataType.U8_Default, DataType.U8_Default) \
+    .dtype_format(DataType.BOOL_Default, DataType.BOOL_Default) \
     .get_op_info()
 
 
diff --git a/mindspore/ops/_op_impl/akg/gpu/tile.py b/mindspore/ops/_op_impl/akg/gpu/tile.py
index e8e634d9a1..32b993f239 100644
--- a/mindspore/ops/_op_impl/akg/gpu/tile.py
+++ b/mindspore/ops/_op_impl/akg/gpu/tile.py
@@ -22,6 +22,8 @@ tile_op_info = AkgGpuRegOp("Tile") \
     .attr("multiples", "required", "listInt") \
     .dtype_format(DataType.F16_Default, DataType.F16_Default) \
     .dtype_format(DataType.F32_Default, DataType.F32_Default) \
+    .dtype_format(DataType.I32_Default, DataType.I32_Default) \
+    .dtype_format(DataType.I16_Default, DataType.I16_Default) \
     .get_op_info()
 
 
diff --git a/tests/st/ops/gpu/test_equal_op.py b/tests/st/ops/gpu/test_equal_op.py
index 5d38a3abd0..adb12728dd 100644
--- a/tests/st/ops/gpu/test_equal_op.py
+++ b/tests/st/ops/gpu/test_equal_op.py
@@ -65,6 +65,21 @@ def test_equal():
     y2_np = np.array([0, 1, -3]).astype(np.int32)
     y2 = Tensor(y2_np)
     expect2 = np.equal(x2_np, y2_np)
+    x3_np = np.array([0, 1, 3]).astype(np.int16)
+    x3 = Tensor(x3_np)
+    y3_np = np.array([0, 1, -3]).astype(np.int16)
+    y3 = Tensor(y3_np)
+    expect3 = np.equal(x3_np, y3_np)
+    x4_np = np.array([0, 1, 4]).astype(np.uint8)
+    x4 = Tensor(x4_np)
+    y4_np = np.array([0, 1, 3]).astype(np.uint8)
+    y4 = Tensor(y4_np)
+    expect4 = np.equal(x4_np, y4_np)
+    x5_np = np.array([True, False, True]).astype(bool)
+    x5 = Tensor(x5_np)
+    y5_np = np.array([True, False, False]).astype(bool)
+    y5 = Tensor(y5_np)
+    expect5 = np.equal(x5_np, y5_np)
 
     context.set_context(mode=context.PYNATIVE_MODE, device_target="GPU")
     equal = NetEqual()
@@ -77,6 +92,17 @@ def test_equal():
     output2 = equal(x2, y2)
     assert np.all(output2.asnumpy() == expect2)
     assert output2.shape == expect2.shape
+    output3 = equal(x3, y3)
+    assert np.all(output3.asnumpy() == expect3)
+    assert output3.shape == expect3.shape
+    output4 = equal(x4, y4)
+    assert np.all(output4.asnumpy() == expect4)
+    assert output4.shape == expect4.shape
+    output5 = equal(x5, y5)
+    assert np.all(output5.asnumpy() == expect5)
+    assert output5.shape == expect5.shape
+
+
 
     context.set_context(mode=context.GRAPH_MODE, device_target="GPU")
     equal = NetEqual()
@@ -89,6 +115,15 @@ def test_equal():
     output2 = equal(x2, y2)
     assert np.all(output2.asnumpy() == expect2)
     assert output2.shape == expect2.shape
+    output3 = equal(x3, y3)
+    assert np.all(output3.asnumpy() == expect3)
+    assert output3.shape == expect3.shape
+    output4 = equal(x4, y4)
+    assert np.all(output4.asnumpy() == expect4)
+    assert output4.shape == expect4.shape
+    output5 = equal(x5, y5)
+    assert np.all(output5.asnumpy() == expect5)
+    assert output5.shape == expect5.shape
 
 
 @pytest.mark.level0
@@ -98,18 +133,45 @@ def test_notequal():
     x0 = Tensor(np.array([[1.2, 1], [1, 0]]).astype(np.float32))
     y0 = Tensor(np.array([[1, 2]]).astype(np.float32))
     expect0 = np.array([[True, True], [False, True]])
+    x1 = Tensor(np.array([[2, 1], [1, 1]]).astype(np.int16))
+    y1 = Tensor(np.array([[1, 2]]).astype(np.int16))
+    expect1 = np.array([[True, True], [False, True]])
+    x2 = Tensor(np.array([[2, 1], [1, 2]]).astype(np.uint8))
+    y2 = Tensor(np.array([[1, 2]]).astype(np.uint8))
+    expect2 = np.array([[True, True], [False, False]])
+    x3 = Tensor(np.array([[False, True], [True, False]]).astype(bool))
+    y3 = Tensor(np.array([[True, False]]).astype(bool))
+    expect3 = np.array([[True, True], [False, False]])
 
     context.set_context(mode=context.PYNATIVE_MODE, device_target="GPU")
     notequal = NetNotEqual()
     output0 = notequal(x0, y0)
     assert np.all(output0.asnumpy() == expect0)
     assert output0.shape == expect0.shape
+    output1 = notequal(x1, y1)
+    assert np.all(output1.asnumpy() == expect1)
+    assert output1.shape == expect1.shape
+    output2 = notequal(x2, y2)
+    assert np.all(output2.asnumpy() == expect2)
+    assert output2.shape == expect2.shape
+    output3 = notequal(x3, y3)
+    assert np.all(output3.asnumpy() == expect3)
+    assert output3.shape == expect3.shape
 
     context.set_context(mode=context.GRAPH_MODE, device_target="GPU")
     notequal = NetNotEqual()
     output0 = notequal(x0, y0)
     assert np.all(output0.asnumpy() == expect0)
     assert output0.shape == expect0.shape
+    output1 = notequal(x1, y1)
+    assert np.all(output1.asnumpy() == expect1)
+    assert output1.shape == expect1.shape
+    output2 = notequal(x2, y2)
+    assert np.all(output2.asnumpy() == expect2)
+    assert output2.shape == expect2.shape
+    output3 = notequal(x3, y3)
+    assert np.all(output3.asnumpy() == expect3)
+    assert output3.shape == expect3.shape
 
 
 @pytest.mark.level0
@@ -119,15 +181,33 @@ def test_greaterqual():
     x0 = Tensor(np.array([[1.2, 1], [1, 0]]).astype(np.float32))
     y0 = Tensor(np.array([[1, 2]]).astype(np.float32))
     expect0 = np.array([[True, False], [True, False]])
+    x1 = Tensor(np.array([[2, 1], [1, 1]]).astype(np.int16))
+    y1 = Tensor(np.array([[1, 2]]).astype(np.int16))
+    expect1 = np.array([[True, False], [True, False]])
+    x2 = Tensor(np.array([[2, 1], [1, 2]]).astype(np.uint8))
+    y2 = Tensor(np.array([[1, 2]]).astype(np.uint8))
+    expect2 = np.array([[True, False], [True, True]])
 
     context.set_context(mode=context.PYNATIVE_MODE, device_target="GPU")
     gequal = NetGreaterEqual()
     output0 = gequal(x0, y0)
     assert np.all(output0.asnumpy() == expect0)
     assert output0.shape == expect0.shape
+    output1 = gequal(x1, y1)
+    assert np.all(output1.asnumpy() == expect1)
+    assert output1.shape == expect1.shape
+    output2 = gequal(x2, y2)
+    assert np.all(output2.asnumpy() == expect2)
+    assert output2.shape == expect2.shape
 
     context.set_context(mode=context.GRAPH_MODE, device_target="GPU")
     gequal = NetGreaterEqual()
     output0 = gequal(x0, y0)
     assert np.all(output0.asnumpy() == expect0)
     assert output0.shape == expect0.shape
+    output1 = gequal(x1, y1)
+    assert np.all(output1.asnumpy() == expect1)
+    assert output1.shape == expect1.shape
+    output2 = gequal(x2, y2)
+    assert np.all(output2.asnumpy() == expect2)
+    assert output2.shape == expect2.shape
diff --git a/tests/st/ops/gpu/test_lessequal_op.py b/tests/st/ops/gpu/test_lessequal_op.py
index 40281af2e1..4888ae2c19 100644
--- a/tests/st/ops/gpu/test_lessequal_op.py
+++ b/tests/st/ops/gpu/test_lessequal_op.py
@@ -38,12 +38,27 @@ def test_lessequal():
     x = Tensor(np.array([[1, 2, 3]]).astype(np.float32))
     y = Tensor(np.array([[2]]).astype(np.float32))
     expect = [[True, True, False]]
+    x1 = Tensor(np.array([[1, 2, 3]]).astype(np.int16))
+    y1 = Tensor(np.array([[2]]).astype(np.int16))
+    expect = [[True, True, False]]
+    x2 = Tensor(np.array([[1, 2, 3]]).astype(np.uint8))
+    y2 = Tensor(np.array([[2]]).astype(np.uint8))
+    expect = [[True, True, False]]
+
     context.set_context(mode=context.PYNATIVE_MODE, device_target="GPU")
     lessequal = Net()
     output = lessequal(x, y)
     assert np.all(output.asnumpy() == expect)
+    output = lessequal(x1, y1)
+    assert np.all(output.asnumpy() == expect)
+    output = lessequal(x2, y2)
+    assert np.all(output.asnumpy() == expect)
 
     context.set_context(mode=context.GRAPH_MODE, device_target="GPU")
     lessequal = Net()
     output = lessequal(x, y)
     assert np.all(output.asnumpy() == expect)
+    output = lessequal(x1, y1)
+    assert np.all(output.asnumpy() == expect)
+    output = lessequal(x2, y2)
+    assert np.all(output.asnumpy() == expect)
diff --git a/tests/st/ops/gpu/test_squeeze_op.py b/tests/st/ops/gpu/test_squeeze_op.py
new file mode 100644
index 0000000000..8728bd51d1
--- /dev/null
+++ b/tests/st/ops/gpu/test_squeeze_op.py
@@ -0,0 +1,79 @@
+# Copyright 2019 Huawei Technologies Co., Ltd
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+# http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+# ============================================================================
+import numpy as np
+
+import mindspore.context as context
+import mindspore.nn as nn
+from mindspore import Tensor
+from mindspore.ops import operations as P
+
+context.set_context(mode=context.PYNATIVE_MODE, device_target="GPU")
+
+
+class Net(nn.Cell):
+    def __init__(self):
+        super(Net, self).__init__()
+        self.squeeze = P.Squeeze()
+
+    def construct(self, tensor):
+        return self.squeeze(tensor)
+
+
+def test_net_bool():
+    x = np.random.randn(1, 16, 1, 1).astype(np.bool)
+    net = Net()
+    output = net(Tensor(x))
+    print(output.asnumpy())
+    assert np.all(output.asnumpy() == x.squeeze())
+
+
+def test_net_uint8():
+    x = np.random.randn(1, 16, 1, 1).astype(np.uint8)
+    net = Net()
+    output = net(Tensor(x))
+    print(output.asnumpy())
+    assert np.all(output.asnumpy() == x.squeeze())
+
+
+def test_net_int16():
+    x = np.random.randn(1, 16, 1, 1).astype(np.int16)
+    net = Net()
+    output = net(Tensor(x))
+    print(output.asnumpy())
+    assert np.all(output.asnumpy() == x.squeeze())
+
+
+def test_net_int32():
+    x = np.random.randn(1, 16, 1, 1).astype(np.int32)
+    net = Net()
+    output = net(Tensor(x))
+    print(output.asnumpy())
+    assert np.all(output.asnumpy() == x.squeeze())
+
+
+def test_net_float16():
+    x = np.random.randn(1, 16, 1, 1).astype(np.float16)
+    net = Net()
+    output = net(Tensor(x))
+    print(output.asnumpy())
+    assert np.all(output.asnumpy() == x.squeeze())
+
+
+def test_net_float32():
+    x = np.random.randn(1, 16, 1, 1).astype(np.float32)
+    net = Net()
+    output = net(Tensor(x))
+    print(output.asnumpy())
+    assert np.all(output.asnumpy() == x.squeeze())
diff --git a/tests/st/ops/gpu/test_tile_op.py b/tests/st/ops/gpu/test_tile_op.py
index 6973ddcdb5..3d65fea24d 100644
--- a/tests/st/ops/gpu/test_tile_op.py
+++ b/tests/st/ops/gpu/test_tile_op.py
@@ -33,6 +33,27 @@ mul1 = (2, 2, 2)
 input_x2 = np.arange(1).reshape((1, 1, 1)).astype(np.float32)
 mul2 = (1, 1, 1)
 
+input_32_x0 = np.arange(2).reshape((2, 1, 1)).astype(np.int32)
+mul_32_0 = (8, 1, 1)
+input_32_x1 = np.arange(32).reshape((2, 4, 4)).astype(np.int32)
+mul_32_1 = (2, 2, 2)
+input_32_x2 = np.arange(1).reshape((1, 1, 1)).astype(np.int32)
+mul_32_2 = (1, 1, 1)
+
+input_16_x0 = np.arange(2).reshape((2, 1, 1)).astype(np.int16)
+mul_16_0 = (8, 1, 1)
+input_16_x1 = np.arange(32).reshape((2, 4, 4)).astype(np.int16)
+mul_16_1 = (2, 2, 2)
+input_16_x2 = np.arange(1).reshape((1, 1, 1)).astype(np.int16)
+mul_16_2 = (1, 1, 1)
+
+input_8_x0 = np.arange(2).reshape((2, 1, 1)).astype(np.uint8)
+mul_8_0 = (8, 1, 1)
+input_8_x1 = np.arange(32).reshape((2, 4, 4)).astype(np.int8)
+mul_8_1 = (2, 2, 2)
+input_8_x2 = np.arange(1).reshape((1, 1, 1)).astype(np.uint8)
+mul_8_2 = (1, 1, 1)
+
 
 class Net(Cell):
     def __init__(self):
@@ -54,6 +75,46 @@ class Net(Cell):
         return output
 
 
+class Net32(Cell):
+    def __init__(self):
+        super(Net32, self).__init__()
+        self.Tile = Tile()
+
+        self.input_32_x0 = Parameter(initializer(Tensor(input_32_x0), input_32_x0.shape), name='x0')
+        self.mul_32_0 = mul_32_0
+        self.input_32_x1 = Parameter(initializer(Tensor(input_32_x1), input_32_x1.shape), name='x1')
+        self.mul_32_1 = mul_32_1
+        self.input_32_x2 = Parameter(initializer(Tensor(input_32_x2), input_32_x2.shape), name='x2')
+        self.mul_32_2 = mul_32_2
+
+    @ms_function
+    def construct(self):
+        output = (self.Tile(self.input_32_x0, self.mul_32_0),
+                  self.Tile(self.input_32_x1, self.mul_32_1),
+                  self.Tile(self.input_32_x2, self.mul_32_2))
+        return output
+
+
+class Net16(Cell):
+    def __init__(self):
+        super(Net16, self).__init__()
+        self.Tile = Tile()
+
+        self.input_16_x0 = Parameter(initializer(Tensor(input_16_x0), input_16_x0.shape), name='x0')
+        self.mul_16_0 = mul_16_0
+        self.input_16_x1 = Parameter(initializer(Tensor(input_16_x1), input_16_x1.shape), name='x1')
+        self.mul_16_1 = mul_16_1
+        self.input_16_x2 = Parameter(initializer(Tensor(input_16_x2), input_16_x2.shape), name='x2')
+        self.mul_16_2 = mul_16_2
+
+    @ms_function
+    def construct(self):
+        output = (self.Tile(self.input_16_x0, self.mul_16_0),
+                  self.Tile(self.input_16_x1, self.mul_16_1),
+                  self.Tile(self.input_16_x2, self.mul_16_2))
+        return output
+
+
 @pytest.mark.level0
 @pytest.mark.platform_x86_gpu_training
 @pytest.mark.env_onecard
@@ -78,3 +139,55 @@ def test_tile():
     error2 = np.ones(shape=expect2.shape) * 1.0e-5
     assert np.all(diff2 < error2)
     assert output[2].shape == expect2.shape
+
+
+@pytest.mark.level0
+@pytest.mark.platform_x86_gpu_training
+@pytest.mark.env_onecard
+def test_tile_32():
+    net = Net32()
+    output = net()
+
+    expect0 = np.tile(input_32_x0, mul_32_0)
+    diff0 = output[0].asnumpy() - expect0
+    error0 = np.ones(shape=expect0.shape) * 1.0e-5
+    assert np.all(diff0 < error0)
+    assert output[0].shape == expect0.shape
+
+    expect1 = np.tile(input_32_x1, mul_32_1)
+    diff1 = output[1].asnumpy() - expect1
+    error1 = np.ones(shape=expect1.shape) * 1.0e-5
+    assert np.all(diff1 < error1)
+    assert output[1].shape == expect1.shape
+
+    expect2 = np.tile(input_32_x2, mul_32_2)
+    diff2 = output[2].asnumpy() - expect2
+    error2 = np.ones(shape=expect2.shape) * 1.0e-5
+    assert np.all(diff2 < error2)
+    assert output[2].shape == expect2.shape
+
+
+@pytest.mark.level0
+@pytest.mark.platform_x86_gpu_training
+@pytest.mark.env_onecard
+def test_tile_16():
+    net = Net16()
+    output = net()
+
+    expect0 = np.tile(input_16_x0, mul_16_0)
+    diff0 = output[0].asnumpy() - expect0
+    error0 = np.ones(shape=expect0.shape) * 1.0e-5
+    assert np.all(diff0 < error0)
+    assert output[0].shape == expect0.shape
+
+    expect1 = np.tile(input_16_x1, mul_16_1)
+    diff1 = output[1].asnumpy() - expect1
+    error1 = np.ones(shape=expect1.shape) * 1.0e-5
+    assert np.all(diff1 < error1)
+    assert output[1].shape == expect1.shape
+
+    expect2 = np.tile(input_16_x2, mul_16_2)
+    diff2 = output[2].asnumpy() - expect2
+    error2 = np.ones(shape=expect2.shape) * 1.0e-5
+    assert np.all(diff2 < error2)
+    assert output[2].shape == expect2.shape