[FLINK-36086] Add test for sqlserver restart during one transaction

1 week ago · a4b5e8b27b
parent 739604e28c
commit a4b5e8b27b
4 changed files with 368 additions and 22 deletions
--- a/flink-cdc-connect/flink-cdc-source-connectors/flink-connector-sqlserver-cdc/pom.xml
+++ b/flink-cdc-connect/flink-cdc-source-connectors/flink-connector-sqlserver-cdc/pom.xml
@ -140,13 +140,12 @@ limitations under the License.
        </dependency>

        <dependency>
-            <groupId>org.awaitility</groupId>
-            <artifactId>awaitility</artifactId>
-            <version>${version.awaitility}</version>
+            <groupId>org.apache.flink</groupId>
+            <artifactId>flink-connector-test-utils</artifactId>
+            <version>${flink.version}</version>
            <scope>test</scope>
        </dependency>

-
    </dependencies>

    <build>
--- a/flink-cdc-connect/flink-cdc-source-connectors/flink-connector-sqlserver-cdc/src/test/java/org/apache/flink/cdc/connectors/sqlserver/SqlServerTestBase.java
+++ b/flink-cdc-connect/flink-cdc-source-connectors/flink-connector-sqlserver-cdc/src/test/java/org/apache/flink/cdc/connectors/sqlserver/SqlServerTestBase.java
@ -17,6 +17,8 @@

 package org.apache.flink.cdc.connectors.sqlserver;

+import org.apache.flink.cdc.connectors.sqlserver.source.SqlServerSourceTestBase;
+import org.apache.flink.cdc.connectors.sqlserver.source.config.SqlServerSourceConfigFactory;
 import org.apache.flink.table.planner.factories.TestValuesTableFactory;
 import org.apache.flink.test.util.AbstractTestBase;

@ -47,6 +49,7 @@ import java.util.stream.Collectors;
 import java.util.stream.Stream;

 import static org.junit.Assert.assertNotNull;
+import static org.testcontainers.containers.MSSQLServerContainer.MS_SQL_SERVER_PORT;

 /** Utility class for sqlserver tests. */
 public class SqlServerTestBase extends AbstractTestBase {
@ -222,4 +225,19 @@ public class SqlServerTestBase extends AbstractTestBase {
            }
        }
    }
+
+    public static SqlServerSourceConfigFactory getConfigFactory(
+            String databaseName, String[] captureTables, int splitSize) {
+        return (SqlServerSourceConfigFactory)
+                new SqlServerSourceConfigFactory()
+                        .hostname(SqlServerSourceTestBase.MSSQL_SERVER_CONTAINER.getHost())
+                        .port(
+                                SqlServerSourceTestBase.MSSQL_SERVER_CONTAINER.getMappedPort(
+                                        MS_SQL_SERVER_PORT))
+                        .username(SqlServerSourceTestBase.MSSQL_SERVER_CONTAINER.getUsername())
+                        .password(SqlServerSourceTestBase.MSSQL_SERVER_CONTAINER.getPassword())
+                        .databaseList(databaseName)
+                        .tableList(captureTables)
+                        .splitSize(splitSize);
+    }
 }
--- a/flink-cdc-connect/flink-cdc-source-connectors/flink-connector-sqlserver-cdc/src/test/java/org/apache/flink/cdc/connectors/sqlserver/source/reader/SqlserverSourceReaderTest.java
+++ b/flink-cdc-connect/flink-cdc-source-connectors/flink-connector-sqlserver-cdc/src/test/java/org/apache/flink/cdc/connectors/sqlserver/source/reader/SqlserverSourceReaderTest.java
@ -0,0 +1,341 @@
+/*
+ * Licensed to the Apache Software Foundation (ASF) under one or more
+ * contributor license agreements.  See the NOTICE file distributed with
+ * this work for additional information regarding copyright ownership.
+ * The ASF licenses this file to You under the Apache License, Version 2.0
+ * (the "License"); you may not use this file except in compliance with
+ * the License.  You may obtain a copy of the License at
+ *
+ *      http://www.apache.org/licenses/LICENSE-2.0
+ *
+ * Unless required by applicable law or agreed to in writing, software
+ * distributed under the License is distributed on an "AS IS" BASIS,
+ * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+ * See the License for the specific language governing permissions and
+ * limitations under the License.
+ */
+
+package org.apache.flink.cdc.connectors.sqlserver.source.reader;
+
+import org.apache.flink.api.common.eventtime.Watermark;
+import org.apache.flink.api.common.typeinfo.TypeInformation;
+import org.apache.flink.api.connector.source.ReaderOutput;
+import org.apache.flink.api.connector.source.SourceOutput;
+import org.apache.flink.api.connector.source.SourceReaderContext;
+import org.apache.flink.cdc.connectors.base.source.meta.offset.Offset;
+import org.apache.flink.cdc.connectors.base.source.meta.offset.OffsetFactory;
+import org.apache.flink.cdc.connectors.base.source.meta.split.SourceRecords;
+import org.apache.flink.cdc.connectors.base.source.meta.split.SourceSplitBase;
+import org.apache.flink.cdc.connectors.base.source.meta.split.SourceSplitSerializer;
+import org.apache.flink.cdc.connectors.base.source.meta.split.SourceSplitState;
+import org.apache.flink.cdc.connectors.base.source.meta.split.StreamSplit;
+import org.apache.flink.cdc.connectors.base.source.metrics.SourceReaderMetrics;
+import org.apache.flink.cdc.connectors.base.source.reader.IncrementalSourceReaderContext;
+import org.apache.flink.cdc.connectors.base.source.reader.IncrementalSourceReaderWithCommit;
+import org.apache.flink.cdc.connectors.base.source.reader.IncrementalSourceRecordEmitter;
+import org.apache.flink.cdc.connectors.base.source.reader.IncrementalSourceSplitReader;
+import org.apache.flink.cdc.connectors.base.source.utils.hooks.SnapshotPhaseHooks;
+import org.apache.flink.cdc.connectors.sqlserver.SqlServerTestBase;
+import org.apache.flink.cdc.connectors.sqlserver.source.SqlServerSourceTestBase;
+import org.apache.flink.cdc.connectors.sqlserver.source.config.SqlServerSourceConfig;
+import org.apache.flink.cdc.connectors.sqlserver.source.dialect.SqlServerDialect;
+import org.apache.flink.cdc.connectors.sqlserver.source.offset.LsnFactory;
+import org.apache.flink.cdc.connectors.sqlserver.testutils.RecordsFormatter;
+import org.apache.flink.cdc.debezium.DebeziumDeserializationSchema;
+import org.apache.flink.connector.base.source.reader.RecordEmitter;
+import org.apache.flink.connector.base.source.reader.RecordsWithSplitIds;
+import org.apache.flink.connector.base.source.reader.synchronization.FutureCompletingBlockingQueue;
+import org.apache.flink.connector.testutils.source.reader.TestingReaderContext;
+import org.apache.flink.core.io.InputStatus;
+import org.apache.flink.table.api.DataTypes;
+import org.apache.flink.table.types.DataType;
+import org.apache.flink.util.Collector;
+
+import io.debezium.relational.TableId;
+import io.debezium.relational.history.TableChanges;
+import org.apache.kafka.connect.source.SourceRecord;
+import org.junit.Test;
+import org.slf4j.Logger;
+import org.slf4j.LoggerFactory;
+
+import java.sql.Connection;
+import java.sql.SQLException;
+import java.sql.Statement;
+import java.util.ArrayList;
+import java.util.Arrays;
+import java.util.Collections;
+import java.util.Iterator;
+import java.util.List;
+import java.util.Map;
+import java.util.function.Supplier;
+
+import static org.apache.flink.cdc.connectors.base.source.meta.split.StreamSplit.STREAM_SPLIT_ID;
+import static org.apache.flink.core.io.InputStatus.MORE_AVAILABLE;
+import static org.junit.Assert.assertEquals;
+
+/** Tests for Sqlserver incremental source reader. */
+public class SqlserverSourceReaderTest extends SqlServerSourceTestBase {
+
+    @Test
+    public void testIncrementalReadFailoverCrossTransaction() throws Exception {
+
+        String databaseName = "customer";
+        String tableName = "dbo.customers";
+
+        initializeSqlServerTable(databaseName);
+
+        final SqlServerSourceConfig sourceConfig =
+                SqlServerTestBase.getConfigFactory(databaseName, new String[] {tableName}, 1)
+                        .create(0);
+
+        final DataType dataType =
+                DataTypes.ROW(
+                        DataTypes.FIELD("id", DataTypes.BIGINT()),
+                        DataTypes.FIELD("name", DataTypes.STRING()),
+                        DataTypes.FIELD("address", DataTypes.STRING()),
+                        DataTypes.FIELD("phone_number", DataTypes.STRING()));
+
+        IncrementalSourceReaderWithCommit reader =
+                createReader(
+                        sourceConfig, new TestingReaderContext(), SnapshotPhaseHooks.empty(), 1);
+        reader.start();
+
+        SqlServerDialect dialect = new SqlServerDialect(sourceConfig);
+
+        Map<TableId, TableChanges.TableChange> tableIdTableChangeMap =
+                dialect.discoverDataCollectionSchemas(sourceConfig);
+
+        // region wait SQL server's cdc log to be ready
+        Offset offset;
+        do {
+            offset = dialect.displayCurrentOffset(sourceConfig);
+        } while (offset.getOffset().isEmpty());
+        // endregion
+
+        StreamSplit streamSplit =
+                new StreamSplit(
+                        STREAM_SPLIT_ID,
+                        new LsnFactory().newOffset(offset.getOffset()),
+                        new LsnFactory().createNoStoppingOffset(),
+                        new ArrayList<>(),
+                        tableIdTableChangeMap,
+                        0,
+                        false,
+                        true);
+
+        reader.addSplits(Collections.singletonList(streamSplit));
+
+        log.info("making changes");
+        // step-1: make 6 change events in one SQL server transaction
+        makeChangeEventsInOneTransaction(databaseName + "." + tableName);
+
+        // step-2: fetch the first 2 records belong to the SQL server transaction
+        String[] expectedRecords =
+                new String[] {
+                    "-U[103, user_3, Shanghai, 123567891234]",
+                    "+U[103, user_3, Hangzhou, 123567891234]"
+                };
+        // the 2 records are produced by 1 operations
+        List<String> actualRecords = consumeRecords(reader, dataType);
+        assertEqualsInOrder(Arrays.asList(expectedRecords), actualRecords);
+        // check the binlog split state
+        List<SourceSplitBase> splitsState = reader.snapshotState(1L);
+
+        assertEquals(1, splitsState.size());
+        reader.close();
+
+        // step-3: mock failover from a restored state
+        IncrementalSourceReaderWithCommit restartReader =
+                createReader(
+                        sourceConfig, new TestingReaderContext(), SnapshotPhaseHooks.empty(), 10);
+        restartReader.start();
+        restartReader.addSplits(splitsState);
+
+        // step-4: fetch the rest 4 records belong to the SQL server transaction
+        String[] expectedRestRecords =
+                new String[] {
+                    "-D[102, user_2, Shanghai, 123567891234]",
+                    "+I[102, user_2, Shanghai, 123567891234]",
+                    "-U[103, user_3, Hangzhou, 123567891234]",
+                    "+U[103, user_3, Shanghai, 123567891234]"
+                };
+
+        // the 4 records are produced by 3 operations
+        List<String> restRecords = consumeRecords(restartReader, dataType);
+        assertEqualsInOrder(Arrays.asList(expectedRestRecords), restRecords);
+        restartReader.close();
+    }
+
+    private void makeChangeEventsInOneTransaction(String tableId) throws SQLException {
+        try (Connection connection = getJdbcConnection();
+                Statement statement = connection.createStatement()) {
+            connection.setAutoCommit(false);
+            // make 6 change events by 4 operations
+            statement.execute("UPDATE " + tableId + " SET address = 'Hangzhou' where id = 103");
+            statement.execute("DELETE FROM " + tableId + " where id = 102");
+            statement.execute(
+                    "INSERT INTO " + tableId + " VALUES(102, 'user_2','Shanghai','123567891234')");
+            statement.execute("UPDATE " + tableId + " SET address = 'Shanghai' where id = 103");
+            connection.commit();
+        }
+    }
+
+    private List<String> consumeRecords(
+            IncrementalSourceReaderWithCommit sourceReader, DataType recordType) throws Exception {
+        // Poll all the n records of the single split.
+        final SimpleReaderOutput output = new SimpleReaderOutput();
+        InputStatus status = MORE_AVAILABLE;
+        sourceReader.pollNext(output);
+        while (MORE_AVAILABLE == status || output.getResults().isEmpty()) {
+            status = sourceReader.pollNext(output);
+        }
+        final RecordsFormatter formatter = new RecordsFormatter(recordType);
+        return formatter.format(output.getResults());
+    }
+
+    public IncrementalSourceReaderWithCommit createReader(
+            SqlServerSourceConfig sourceConfig,
+            SourceReaderContext readerContext,
+            SnapshotPhaseHooks snapshotHooks,
+            int limit)
+            throws Exception {
+        // create source config for the given subtask (e.g. unique server id)
+        FutureCompletingBlockingQueue<RecordsWithSplitIds<SourceRecords>> elementsQueue =
+                new FutureCompletingBlockingQueue<>();
+
+        IncrementalSourceReaderContext incrementalSourceReaderContext =
+                new IncrementalSourceReaderContext(readerContext);
+
+        Supplier splitReaderSupplier =
+                () ->
+                        new IncrementalSourceSplitReader<>(
+                                readerContext.getIndexOfSubtask(),
+                                new SqlServerDialect(sourceConfig),
+                                sourceConfig,
+                                incrementalSourceReaderContext,
+                                snapshotHooks);
+
+        final RecordEmitter recordEmitter =
+                new SqlserverLimitRecordEmitter<>(
+                        new ForwardDeserializeSchema(),
+                        new SourceReaderMetrics(readerContext.metricGroup()),
+                        sourceConfig.isIncludeSchemaChanges(),
+                        new LsnFactory(),
+                        limit);
+
+        return new IncrementalSourceReaderWithCommit(
+                elementsQueue,
+                splitReaderSupplier,
+                recordEmitter,
+                readerContext.getConfiguration(),
+                incrementalSourceReaderContext,
+                sourceConfig,
+                new SourceSplitSerializer() {
+                    @Override
+                    public OffsetFactory getOffsetFactory() {
+                        return new LsnFactory();
+                    }
+                },
+                new SqlServerDialect(sourceConfig));
+    }
+
+    // ------------------------------------------------------------------------
+    //  test utilities
+    // ------------------------------------------------------------------------
+
+    private static class SimpleReaderOutput implements ReaderOutput<SourceRecord> {
+
+        private final List<SourceRecord> results = new ArrayList<>();
+
+        @Override
+        public void collect(SourceRecord record) {
+            results.add(record);
+        }
+
+        public List<SourceRecord> getResults() {
+            return results;
+        }
+
+        @Override
+        public void collect(SourceRecord record, long timestamp) {
+            collect(record);
+        }
+
+        @Override
+        public void emitWatermark(Watermark watermark) {}
+
+        @Override
+        public void markIdle() {}
+
+        @Override
+        public void markActive() {
+            throw new UnsupportedOperationException();
+        }
+
+        @Override
+        public SourceOutput<SourceRecord> createOutputForSplit(java.lang.String splitId) {
+            return this;
+        }
+
+        @Override
+        public void releaseOutputForSplit(java.lang.String splitId) {}
+    }
+
+    private static class ForwardDeserializeSchema<T> implements DebeziumDeserializationSchema<T> {
+
+        private static final long serialVersionUID = 1L;
+
+        @Override
+        public void deserialize(SourceRecord record, Collector<T> out) throws Exception {
+            out.collect((T) record);
+        }
+
+        @Override
+        public TypeInformation<T> getProducedType() {
+            return TypeInformation.of((Class<T>) SourceRecord.class);
+        }
+    }
+
+    /**
+     * A implementation of {@link RecordEmitter} which only emit records in given limit number, this
+     * class is used for test purpose.
+     */
+    private static class SqlserverLimitRecordEmitter<T> extends IncrementalSourceRecordEmitter<T> {
+
+        private static final Logger LOG =
+                LoggerFactory.getLogger(SqlserverLimitRecordEmitter.class);
+
+        private final int limit;
+
+        private SqlserverLimitRecordEmitter(
+                DebeziumDeserializationSchema<T> debeziumDeserializationSchema,
+                SourceReaderMetrics sourceReaderMetrics,
+                boolean includeSchemaChanges,
+                OffsetFactory offsetFactory,
+                int limit) {
+            super(
+                    debeziumDeserializationSchema,
+                    sourceReaderMetrics,
+                    includeSchemaChanges,
+                    offsetFactory);
+            this.limit = limit;
+        }
+
+        @Override
+        public void emitRecord(
+                SourceRecords sourceRecords, SourceOutput<T> output, SourceSplitState splitState)
+                throws Exception {
+            int sendCnt = 0;
+            final Iterator<SourceRecord> elementIterator = sourceRecords.iterator();
+            while (elementIterator.hasNext()) {
+                if (sendCnt >= limit) {
+                    break;
+                }
+                SourceRecord next = elementIterator.next();
+                LOG.debug("SqlserverLimitRecordEmitter emit record: {}", next);
+                processElement(next, output, splitState);
+                sendCnt++;
+            }
+        }
+    }
+}
--- a/flink-cdc-connect/flink-cdc-source-connectors/flink-connector-sqlserver-cdc/src/test/java/org/apache/flink/cdc/connectors/sqlserver/source/reader/fetch/SqlServerScanFetchTaskTest.java
+++ b/flink-cdc-connect/flink-cdc-source-connectors/flink-connector-sqlserver-cdc/src/test/java/org/apache/flink/cdc/connectors/sqlserver/source/reader/fetch/SqlServerScanFetchTaskTest.java
@ -15,7 +15,7 @@
 * limitations under the License.
 */

-package org.apache.flink.cdc.connectors.sqlserver.source.read.fetch;
+package org.apache.flink.cdc.connectors.sqlserver.source.reader.fetch;

 import org.apache.flink.cdc.connectors.base.config.JdbcSourceConfig;
 import org.apache.flink.cdc.connectors.base.dialect.JdbcDataSourceDialect;
@ -34,8 +34,6 @@ import org.apache.flink.cdc.connectors.sqlserver.source.config.SqlServerSourceCo
 import org.apache.flink.cdc.connectors.sqlserver.source.config.SqlServerSourceConfigFactory;
 import org.apache.flink.cdc.connectors.sqlserver.source.dialect.SqlServerDialect;
 import org.apache.flink.cdc.connectors.sqlserver.source.offset.LsnFactory;
-import org.apache.flink.cdc.connectors.sqlserver.source.reader.fetch.SqlServerScanFetchTask;
-import org.apache.flink.cdc.connectors.sqlserver.source.reader.fetch.SqlServerSourceFetchTaskContext;
 import org.apache.flink.cdc.connectors.sqlserver.testutils.RecordsFormatter;
 import org.apache.flink.metrics.groups.UnregisteredMetricsGroup;
 import org.apache.flink.table.api.DataTypes;
@ -54,14 +52,17 @@ import java.util.Iterator;
 import java.util.List;
 import java.util.Optional;

+import static org.apache.flink.cdc.connectors.sqlserver.SqlServerTestBase.getConfigFactory;
 import static org.apache.flink.cdc.connectors.sqlserver.source.utils.SqlServerConnectionUtils.createSqlServerConnection;
 import static org.junit.Assert.assertEquals;
 import static org.junit.Assert.assertFalse;
 import static org.junit.Assert.assertNotNull;
 import static org.junit.Assert.assertTrue;
-import static org.testcontainers.containers.MSSQLServerContainer.MS_SQL_SERVER_PORT;

-/** Tests for {@link SqlServerScanFetchTask}. */
+/**
+ * Tests for {@link
+ * org.apache.flink.cdc.connectors.sqlserver.source.reader.fetch.SqlServerScanFetchTask}.
+ */
 public class SqlServerScanFetchTaskTest extends SqlServerSourceTestBase {

    @Test
@ -348,19 +349,6 @@ public class SqlServerScanFetchTaskTest extends SqlServerSourceTestBase {
        return snapshotSplitList;
    }

-    public static SqlServerSourceConfigFactory getConfigFactory(
-            String databaseName, String[] captureTables, int splitSize) {
-        return (SqlServerSourceConfigFactory)
-                new SqlServerSourceConfigFactory()
-                        .hostname(MSSQL_SERVER_CONTAINER.getHost())
-                        .port(MSSQL_SERVER_CONTAINER.getMappedPort(MS_SQL_SERVER_PORT))
-                        .username(MSSQL_SERVER_CONTAINER.getUsername())
-                        .password(MSSQL_SERVER_CONTAINER.getPassword())
-                        .databaseList(databaseName)
-                        .tableList(captureTables)
-                        .splitSize(splitSize);
-    }
-
    private boolean executeSql(SqlServerSourceConfig sourceConfig, String[] sqlStatements) {
        try (JdbcConnection connection =
                createSqlServerConnection(sourceConfig.getDbzConnectorConfig())) {